期权交易

9.9和9.11哪个大？马斯克的Grok-3也翻车了

发布日期：2025-02-24 14:52 点击次数：184

　　9.11和9.9哪个大？

　　这是一个曾让不少大模子“翻车”的数学题。北京时辰2月19日，在马斯克发布自称“ 全国上最智谋的东谈主工智能”Grok-3后，有效户尝试测试版块，发现该模子在不加任何定语及标注的情况下，无法正确恢复刁难AI大模子的经典问题。

　　第一财经向Grok-3发问后，AI恢复称“9.11比9.9大”，奏凯“翻车”。不外，也有赢得测试阅历的用户暗意，Grok-3的性能很好，笃定处于行业第一梯队。

　　昨日，xAI的Grok-3认真发布，马斯克称之为“全国上最智谋的东谈主工智能。”Grok-3降生于超大型AI智算中心之上，该AI智算中心起初配有10万块英伟达高端显卡，后续扩容至20万块。此前DeepSeek-V3模子官方告示仅用2000余块英伟达显卡，以及600万好意思元预算。

　　合并天，DeepSeek官方在国外应答平台X上发布了一篇纯技巧论文讲明，主要本体对于NSA （Natively Sparse Attention，原生寥落注办法），进一步展示了DeepSeek团队在软硬件优化，降本增效方面的追求。

　　xAI团队在直播中暗意：“为了研发下一代更高性能的AI，咱们正在商讨下一个AI智算中心，这将比现在的强苟简5倍。”不单是是xAI，近期谷歌、微软、Meta、亚马逊四家国外大厂极大提高了2025年本钱开支，合计达到数千亿好意思元，并称大部分本钱开支将用于AI智算中心开辟。另外，本年头公布的星际之门诡计投资5000亿好意思元用于AI智算中心开辟。

　　达不雅数据衔接首创东谈主张健对记者说：“Grok-3依然撤职狂妄出遗址的缩放定律，通过堆叠多量算力和增大模子限制，追求极致性能普及。这种相貌短期内可能在特定评测主义上取得率先，但性价比相对较低，借钱炒股更像是在探索模子性能的上限。”

　　但也有从业者暗意“狂妄出遗址”的念念路还有较长的路要走，并觉得设置地间不久的xAI，简略在短时辰内已毕一流的性能水平，证明卷算力，卷投资仍有价值。

　　韦豪创芯结伴东谈主王智此前向记者暗意，AI向畴昔演进，更多新架构和算法，永恒而言，饱和算力的营救必不行少。

　　不外越来越多东谈主驱动质疑这种“狂妄出遗址”的标的。有挑剔称单看基准测试，天然Grok-3各项数据率先，然则普及幅度并不大，尤其沟通到xAI照旧花费多量资金用来锻练Grok-3。

　　“马斯克的AI智算集群有野心荒谬激进，不仅条目大限制的资金参加，况兼条目快速部署快速上马。”Omdia分析师王珅告诉记者。

　　张健觉得，无论是DeepSeek照旧Grok3，两种标的并非完好意思对立，而是各有侧重，可能永恒并存，并在技巧发展中安逸交融。“Grok 3 代表着对性能极限的探索，Deepseek 则代表着对实用性和成果的追求。两者共同鼓动AI技巧非常，最终主义皆是构建更雄壮、更智能、更实用的AI系统。”张健暗意。

　　王珅觉得，这两种标的的侧重可能有着先后规章。“咱们团队判断，在2026年至2027年间，AI智算中心的堆算力岑岭会畴昔，然后是各式硬件和模子的深度优化打磨。中国由于硬件截至，会更早强调优化。”

　　上海市东谈主工智能行业协会文告长钟俊浩告诉记者：“两种标的皆热切，但有着优先级的各别，对性能极限探索是基础，而追务实用性和成果的标的要站在前者基础之上。”

栏目分类

让建站和SEO变得简单

9.9和9.11哪个大？马斯克的Grok-3也翻车了

发布日期：2025-02-24 14:52 点击次数：184