川观新闻记者 唐泽文
北京时间2月18日中午12时许,马斯克在社交平台X(原twitter)上开启直播,正式对外发布最新大模型Grok3。此前,他声称Grok3为“地表最强AI”。
发布会正式开始的时间比计划晚了10来分钟。有网友调侃,这是马斯克想表达“后来居上”的意思。
不过,到底能不能“居上”?
整个AI行业其实很关注这次发布。主要原因在于,被DeepSeek反转的“不依赖大算力”的低成本模式,会不会再次发生反转?
要知道,Grok3背后,是10万张H100和H200芯片,这一数字高于以往任何一个大模型的使用规模。跟Grok自己相比,Grok3所涉及的训练量是Grok2的10倍。它走的仍然是“大力出奇迹”的技术路线。
不过比较可惜的是,仅从发布会上看,还暂时得不出答案。
发布会上,马斯克自己给出的对比数据是,Grok3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。
如果你比较细心,会发现一个小细节:他对比的是DeepSeek-V3,而不是前段时间全球大火的DeepSeek-R1。
R1是DeepSeek的最新版本,与V3的区别主要在于其推理能力的提升,让全球感到惊讶的主要原因也在于其强大的推理能力。
Grok3工程师现场也大概解释了下。约一个月前,Grok3预训练就已完成,团队一直在努力将推理能力整合到Grok3中。不过,这仍处于早期阶段,模型仍在进行训练。当天展示的仅是Grok3推理模型的一部分。
所以“大力出奇迹”到底赢没赢,现在还无法判定。
发布会上有一个亮眼的环节,开发团队现场要求Grok3制作一款类似于俄罗斯方块的游戏。它只思考了数分钟,就大致完成了任务。
对此,唐探也采访了几位国内大模型厂商的工程师,他们几乎都提到了这一环节。大家认为,这个环节侧面展示出Grok3在编程应用领域和多模态识别领域的优势。
尤其是除文字外,还囊括图片、视频、音频等的多模态领域——特斯拉所收集的多模态数据来自“实体”世界,如果Grok3再接入社交平台X,这两家马斯克自有的公司就能给大模型提供大量“虚”“实”数据供其训练,Grok3有可能依赖这些独家资源实现质的提升。
要真“大力出奇迹”了,我们会不会再次被拉开距离?
其实也不必过于担心。DeepSeek出现之前,这样的声音就一直存在。
况且,我们的“大力”也在成长之中。
一周前,国内芯片公司无问芯穹就推出支持DeepSeek多芯片适配和推理的AI异构云大模型服务平台。在这个平台上,7家国产AI芯片的算力,也能跑“满血版”的AI大模型。
这次发布的另一个有意思的小细节是,发布会前几个小时,OpenAI首席执行官山姆·奥特曼公开表示,根据反馈,GPT-4.5试用者感受到的AGI体验,比预期要高得多。
到底谁将是地表最强?得让子弹再飞一会儿。
【未经授权,严禁转载!联系电话028-86968276】
最强这个不知道是不是,但最烧钱肯定是了,马斯克有钱任性,不过目测dp可以弯道超车
马斯克用大量芯片堆出 Grok3,走 “大力出奇迹” 路线,确实吸引眼球。但目前还无法判定它是否真的领先,期待后续的实际应用测试。国内 AI 发展也很快,像无问芯穹的平台,说明我们也在不断追赶,不会轻易被拉开差距。
大模型实验
DS和Grok 3孰强孰弱我不知道,作为一个文科生,我就想知道:如何才能给AI下达精准指令,从而提高利用效率?哪里有教材,在线等,挺急的