川观智库研究员 李媛莉

当全球科技巨头围绕“千亿参数大模型”展开竞赛时,来自中国的DeepSeek(深度求索)却以“低成本、高性能、全开源”的策略,成为搅动行业格局的颠覆者。DeepSeek是什么?究竟有哪些重大影响及意义?川观智库借鉴“大模型”学习思维,对25篇以DeepSeek为对象的研究报告、媒体报道、自媒体以及专栏作者的文章进行学习,整理归纳出业界的主要观点和多维解读,供读者Deep(深度)认识DeepSeek。

DeepSeek为何物?其一,它是一家名叫DeepSeek(深度求索)的公司,也是除大厂外唯一一家能做通用大模型的中国AI初创公司。其二,它是深度求索公司的大模型产品,即开源大模型DeepSeek-V3,该大模型不仅在性能上超越全球多个主流开源模型,包括扎克伯格的LLaMa 3.1,而且以极低的训练成本著称,被业界视为对AI算力需求神话的颠覆,也迫使英伟达等芯片巨头重新评估市场格局。美国总统特朗普也承认DeepSeek的模型高效且经济,直言DeepSeek的出现“给美国相关产业敲响了警钟”。有学者评价DeepSeek书写了又一个“斯普特尼克时刻”,有业内人士说“185年来中国出现的对人类最大的震撼是DeepSeek”。

DeepSeek到底有什么意义?第一是技术突破,DeepSeek重新定义AI研发的“性价比”。简而言之,DeepSeek攻克了大模型训练的“不可能三角”——高性能、低成本和易用性。传统大模型训练需消耗数亿美元算力,而DeepSeek-V3仅用557.6万美元便实现了与GPT-4 Turbo相当的性能。这种通过动态调整神经元激活范围的方法,将算力消耗降低至行业平均水平的1/10。更震动全球业界的是,DeepSeek不仅公开了模型权重,还开源了训练细节——这在以封闭生态为主的AI领域堪称“革命性举动”。因此不乏业内人士评价DeepSeek是良好支持中文的、便于普遍企业都能低成本运行起来的、效果最好的预训练大模型。斯坦福AI实验室研究员约翰·卡特评价称,“DeepSeek的开源策略正在改变全球开发者的协作方式。”

第二是对商业的颠覆, DeepSeek的API定价策略被业界称为“人工智能界的拼多多”,因为其服务价格仅为GPT-4的1/50,且支持本地化部署。这种低价策略能迅速激活中小企业的需求,据公开报道,一家浙江纺织企业用DeepSeek模型优化生产线后,能耗降低了15%。DeepSeek的出现迫使微软、谷歌等公司紧急调整定价策略,GPT-4 Turbo的API价格在一个月内骤降60%。

第三是DeepSeek对全球AI格局的改变。最深远的影响在于供应链自主。DeepSeek通过优化算法和硬件利用效率,降低了对高端GPU的依赖,有助于推动国产芯片在AI领域的应用和普及。比如DeepSeek与华为昇腾芯片的深度适配,推动国产AI算力链加速成熟。2024年第二季度,昇腾910B芯片出货量同比激增200%,中国AI硬件自主化进程迈出关键一步。再者,DeepSeek的开源和低价策略降低了AI技术的使用门槛,推动了全球AI技术的普及和应用,尤其是发展中国家。2024年5月,欧盟委员会在修订《人工智能法案》时,首次将DeepSeek的技术路线纳入监管参考框架;非洲联盟则直接采用其模型搭建跨境数据协作平台。“这不仅是技术输出,更是一种价值观的传播。”新加坡国立大学李光耀公共政策学院教授陈凯分析称,“当西方强调AI安全管控时,DeepSeek通过开源社区构建起去中心化的技术生态,这种‘柔性影响力’正在改变规则制定的话语权。”

DeepSeek的横空出世伴随着响亮宣告——当全球沉迷于“更大、更贵、更封闭”的AI竞赛时,中国的创新者正用开源、普惠和务实主义,重新定义技术革命的路径。  正如《经济学人》的评论:DeepSeek或许尚未在参数规模上登顶,但它提出的问题比答案更重要——当AI技术真正成为公共品,人类将迎来怎样的未来?