扫码查看

唐探经济圈丨自称“地表最强AI”的Grok3发布，能否“大力出奇迹”？

川观新闻 2025-02-18 22:28

川观新闻 | 记者唐泽文

2025-02-18 22:28

全文播报

四川

进入频道

川观新闻记者唐泽文

北京时间2月18日中午12时许，马斯克在社交平台X（原twitter）上开启直播，正式对外发布最新大模型Grok3。此前，他声称Grok3为“地表最强AI”。

发布会正式开始的时间比计划晚了10来分钟。有网友调侃，这是马斯克想表达“后来居上”的意思。

不过，到底能不能“居上”？

整个AI行业其实很关注这次发布。主要原因在于，被DeepSeek反转的“不依赖大算力”的低成本模式，会不会再次发生反转？

要知道，Grok3背后，是10万张H100和H200芯片，这一数字高于以往任何一个大模型的使用规模。跟Grok自己相比，Grok3所涉及的训练量是Grok2的10倍。它走的仍然是“大力出奇迹”的技术路线。

不过比较可惜的是，仅从发布会上看，还暂时得不出答案。

发布会上，马斯克自己给出的对比数据是，Grok3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。

如果你比较细心，会发现一个小细节：他对比的是DeepSeek-V3，而不是前段时间全球大火的DeepSeek-R1。

R1是DeepSeek的最新版本，与V3的区别主要在于其推理能力的提升，让全球感到惊讶的主要原因也在于其强大的推理能力。

Grok3工程师现场也大概解释了下。约一个月前，Grok3预训练就已完成，团队一直在努力将推理能力整合到Grok3中。不过，这仍处于早期阶段，模型仍在进行训练。当天展示的仅是Grok3推理模型的一部分。

所以“大力出奇迹”到底赢没赢，现在还无法判定。

发布会上有一个亮眼的环节，开发团队现场要求Grok3制作一款类似于俄罗斯方块的游戏。它只思考了数分钟，就大致完成了任务。

对此，唐探也采访了几位国内大模型厂商的工程师，他们几乎都提到了这一环节。大家认为，这个环节侧面展示出Grok3在编程应用领域和多模态识别领域的优势。

尤其是除文字外，还囊括图片、视频、音频等的多模态领域——特斯拉所收集的多模态数据来自“实体”世界，如果Grok3再接入社交平台X，这两家马斯克自有的公司就能给大模型提供大量“虚”“实”数据供其训练，Grok3有可能依赖这些独家资源实现质的提升。

要真“大力出奇迹”了，我们会不会再次被拉开距离？

其实也不必过于担心。DeepSeek出现之前，这样的声音就一直存在。

况且，我们的“大力”也在成长之中。

一周前，国内芯片公司无问芯穹就推出支持DeepSeek多芯片适配和推理的AI异构云大模型服务平台。在这个平台上，7家国产AI芯片的算力，也能跑“满血版”的AI大模型。

这次发布的另一个有意思的小细节是，发布会前几个小时，OpenAI首席执行官山姆·奥特曼公开表示，根据反馈，GPT-4.5试用者感受到的AGI体验，比预期要高得多。

到底谁将是地表最强？得让子弹再飞一会儿。

【未经授权，严禁转载！联系电话028-86968276】

打开川观新闻，阅读全文

精彩评论 4

川观网友z78611 2025-02-18

15

最强这个不知道是不是，但最烧钱肯定是了，马斯克有钱任性，不过目测dp可以弯道超车
忆梦如昔︶ 2025-02-18

10

马斯克用大量芯片堆出 Grok3，走 “大力出奇迹” 路线，确实吸引眼球。但目前还无法判定它是否真的领先，期待后续的实际应用测试。国内 AI 发展也很快，像无问芯穹的平台，说明我们也在不断追赶，不会轻易被拉开差距。
大汉城进哥哥 2025-02-18

10

大模型实验
川观网友83679 2025-02-19

0

DS和Grok 3孰强孰弱我不知道，作为一个文科生，我就想知道：如何才能给AI下达精准指令，从而提高利用效率？哪里有教材，在线等，挺急的

查看更多评论

我要评论

精彩评论

关注我们