川观新闻记者 唐泽文

北京时间2月18日中午12时许,马斯克在社交平台X(原twitter)上开启直播,正式对外发布最新大模型Grok3。此前,他声称Grok3为“地表最强AI”。

发布会正式开始的时间比计划晚了10来分钟。有网友调侃,这是马斯克想表达“后来居上”的意思。

不过,到底能不能“居上”?

整个AI行业其实很关注这次发布。主要原因在于,被DeepSeek反转的“不依赖大算力”的低成本模式,会不会再次发生反转?

要知道,Grok3背后,是10万张H100和H200芯片,这一数字高于以往任何一个大模型的使用规模。跟Grok自己相比,Grok3所涉及的训练量是Grok2的10倍。它走的仍然是“大力出奇迹”的技术路线。

不过比较可惜的是,仅从发布会上看,还暂时得不出答案。

发布会上,马斯克自己给出的对比数据是,Grok3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。

如果你比较细心,会发现一个小细节:他对比的是DeepSeek-V3,而不是前段时间全球大火的DeepSeek-R1。

R1是DeepSeek的最新版本,与V3的区别主要在于其推理能力的提升,让全球感到惊讶的主要原因也在于其强大的推理能力。

Grok3工程师现场也大概解释了下。约一个月前,Grok3预训练就已完成,团队一直在努力将推理能力整合到Grok3中。不过,这仍处于早期阶段,模型仍在进行训练。当天展示的仅是Grok3推理模型的一部分。

所以“大力出奇迹”到底赢没赢,现在还无法判定。

发布会上有一个亮眼的环节,开发团队现场要求Grok3制作一款类似于俄罗斯方块的游戏。它只思考了数分钟,就大致完成了任务。

对此,唐探也采访了几位国内大模型厂商的工程师,他们几乎都提到了这一环节。大家认为,这个环节侧面展示出Grok3在编程应用领域和多模态识别领域的优势。

尤其是除文字外,还囊括图片、视频、音频等的多模态领域——特斯拉所收集的多模态数据来自“实体”世界,如果Grok3再接入社交平台X,这两家马斯克自有的公司就能给大模型提供大量“虚”“实”数据供其训练,Grok3有可能依赖这些独家资源实现质的提升。

要真“大力出奇迹”了,我们会不会再次被拉开距离?

其实也不必过于担心。DeepSeek出现之前,这样的声音就一直存在。

况且,我们的“大力”也在成长之中。

一周前,国内芯片公司无问芯穹就推出支持DeepSeek多芯片适配和推理的AI异构云大模型服务平台。在这个平台上,7家国产AI芯片的算力,也能跑“满血版”的AI大模型。

这次发布的另一个有意思的小细节是,发布会前几个小时,OpenAI首席执行官山姆·奥特曼公开表示,根据反馈,GPT-4.5试用者感受到的AGI体验,比预期要高得多。

到底谁将是地表最强?得让子弹再飞一会儿。