20万块英伟达芯片练出Grok 3:测试得分均高于竞争敌手 运算才略是上代10倍
预热许久的“地表最奢睿AI”Grok 3厚爱亮相。
2月18日,特斯拉创举东说念主埃隆·马斯克旗下xAI推出最新大模子Grok 3,并在直播中进行了现场演示。马斯克称,稀疏欢乐好像推出 Grok3,它的才略将在短时辰内比Grok2高大了十倍。“xAI和Grok的宗旨是清醒天下的试验。”
功能竣工的Grok 3将在一周后厚爱上线,不外用户依旧需要“钞才略”才调体验到最新版块的Grok。
直播先容,Grok 3测试版现已面向马斯克旗下X平台的X Premium订阅用户洞开,“咱们今天将推出Grok3,领先从X上的Premium Plus订阅者开动,他们将是第一批得回探听权限的东说念主。请确保更新您的X应用形式以探索统共高等功能,因为咱们刚刚发布了更新。若是您有酷爱尽早使用Grok 3,请注册Premium Plus。”
xAI还针对Grok 3建设了新的订阅功能。“此外,咱们还将为想要得回源流进功能和尽早使用新功能的古道粉丝推出一项名为Super Grok的单独订阅。这项做事适用于Grok应用形式和新网站grok.com。”据报说念,
马斯克暗意,预测一周之后Grok 3的统共功能将厚爱上线。他说,“若是你想要一个更完善的版块,可能值得恭候一周,但每天王人会有所篡改。咱们还在建设语音交互功能,以便你不错领有对话体验。我今天早些时间试过了,后果很好,尽管它仍然需要一些完善。咱们的宗旨是让你不错像和东说念主交谈雷同和它交谈。我合计这将是Grok3最好的体验之一,但这应该还要一周操纵的时辰。”
马斯克说,谋略在每次发布新版块时,对上一版块进行开源,也即是说,几个月后Grok 2行将开源。
xAI工程师先容,诚然Grok起步较晚,但在MMLU(大界限多任务谈话清醒基准测试)得分上以超快地速率追上了ChatGPT,Grok 3和轻量化的Grok 3 mini在多方面性能上王人跨越或失色Gemini、DeepSeek和GPT-4o等敌手。

据先容,Grok 3在数学推理、科学逻辑推理和代码写稿等名宗旨Benchmark测试(基准测试)中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 Pro更优的后果。Grok 3区别得分为52、75和57。Grok 3 mini区别得分为40、65和41。这两个模子的得分王人高于Gemini、DeepSeek、Claude和GPT。

工程师说,“苟简五天前,AIME2025竞赛截止了,高中生们在一个特定的基准上竞争。然后咱们让两个模子在吞并场检修中在吞并基准上竞争。真谛的是,更大的Grok3推理模子在这场检修中进展更好。这标明,白银投资与较小的模子比拟,较大的模子具有更强的泛化才略。相关词,在旧年的检修中,较小的模子进展更好,因为它更灵验地学习了当年的检修。”
在加州大学伯克利分校推出的Chatbot Arena (LMSYS)盲测中,早期版块的Grok 3假名“巧克力”打榜,一举夺魁并成为唯独一个得分超1400的模子,其在代码、教唆反映等各个方面名次均为第一。
据马斯克此前先容,Grok 3是在宽绰的合成数据上西宾的。它会反复查验数据,试图达到逻辑一致性。若是有失误的数据,它会反念念并删除失误数据。
值得一提的是,有工程师还走漏了xAI旗下超算中默算力也曾翻倍,英伟达GPU数目已达到20万块。
据先容,旧年4月,马斯克合计xAI若想告捷打造出最好AI,唯独路线是自建数据中心。由于想尽快推出Grok 3,时辰进击,于是决定在四个月内建成数据中心。最终,团队耗时122天让第一批10万个GPU启动并运行。
不外要构建祈望中的AI需将集群界限翻倍。发布会上走漏,这亦然团队初度公开驳倒此事,团队仅用92天就也曾收场了超算集群的算力翻倍,也即是GPU数目已达20万块。如今,xAI正专揽这些高大的盘算才略抓续篡改居品。

团队还走漏,xAI也曾开动征询下一个集群,为了好像带动更为高大的AI,其功率将晋升约五倍,达到苟简1.2千兆瓦。
现场,马斯克和工程师们演示了Grok 3的多种才略。在演示中,Grok 3为天外辐射生成动画3D,以及建设了一款将俄罗斯方块和相持迷阵聚拢的游戏。

Grok 3为天外辐射生成动画3D

Grok 3建设的游戏
此外,xAI的游戏使命室也厚爱得到官宣。马斯克暗意,“咱们将在xAI推出一个东说念主工智能游戏使命室。若是你有酷爱加入咱们并建设东说念主工智能驱动的游戏,请加入咱们。”