距离DeepSeek-R1引爆全球市场,已经过去了15个月。
这一年多里,行业迭代节奏空前提速。ChatGPT从4.1版本持续更新至5.5版本,谷歌Gemini不断加码技术迭代;国内字节跳动、阿里、腾讯、智谱等头部企业,也发布或迭代了各自的模型。
唯独DeepSeek,除了去年底一次小幅版本迭代外,始终在低调观望。
2026年4月24日,这份沉默终于有了回响。
DeepSeek-V4正式上线
为当前最好的开源模型
4月24日,DeepSeek宣布,全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。
按照DeepSeek官方披露的信息,V4模型按大小分为Pro和Flash两个版本,也对应目前官方网页端和APP界面的专家模式和快速模式。其中Pro版本总参数为1.6万亿,激活参数为490亿,预训练数据规模33万亿;Flash版本总参数为2840亿,激活参数为130亿,预训练数据规模32万亿。
两款模型均标配百万字超长上下文窗口,在智能体(Agent)能力、世界知识储备、逻辑推理三大核心维度,达成国内水平与开源赛道的双重领先。
在具体性能上,两个版本的定位不同,V4-Pro性能比肩顶级闭源模型,而V4-Flash是更快捷高效的经济之选。
相比前代模型,V4-Pro的Agent能力显著增强。在Agentic Coding(智能体编程)评测中,V4-Pro达到当前开源模型最佳水平。
据悉,DeepSeek-V4已成为DeepSeek内部员工使用的Agentic Coding模型,据评测反馈使用体验优于Anthropic的Sonnet 4.5,交付质量接近Opus 4.6非思考模式,但仍与其思考模式存在一定差距。
在世界知识测评中,V4-Pro大幅领先其他开源模型,稍逊于顶尖闭源模型Gemini-Pro-3.1。在数学、STEM、竞赛型代码的测评中,V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的成绩。
在推理上,官方在论文中表示,总体约落后前沿闭源模型3–6个月。Pro-Max(Max表示最大推理能力模式)推理扩展后在标准推理基准上优于OpenAI的GPT-5.2、谷歌Gemini-3.0-Pro,略逊于GPT-5.4、Gemini-3.1-Pro。
相比V4-Pro,V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。在Agent测评中,V4-Flash在简单任务上与V4-Pro旗鼓相当,但在高难度任务上仍有差距。
深度绑定国产算力
全面适配昇腾950
本次DeepSeek-V4发布,行业最大关注点并非模型性能升级,而是其与国产算力生态的深度绑定。
4月24日模型发布当天,华为同步官宣:昇腾超节点全系列产品(A2、A3、950)全面支持DeepSeek-V4系列。据华为披露,基于V4-Pro模型,昇腾950超节点在8K输入场景下可实现TPOT约20ms、单卡Decode吞吐4700TPS;V4-Flash场景下TPOT约10ms、单卡吞吐1600TPS,算力调度效率突出。
另一边,DeepSeek在披露价格的同时,还在价格栏的小字中明确提到:受限于高端算力,目前DeepSeek-V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。
这也意味着,DeepSeek-V4已完成对华为昇腾950国产AI芯片的原生适配,未来将依托国产算力底座,实现大模型调用成本的规模化下探。
作为华为2026年主力落地的新一代AI芯片,昇腾950聚焦万亿级大模型训练与推理场景,是昇腾910系列的全面迭代升级产品。IDC发布的2026年4月行业数据显示,2025年华为昇腾稳居国产AI芯片出货量榜首,业内普遍预判,2026年昇腾950系列将持续领跑国内商用AI芯片市场。
华为生态合作方业内人士评价,在当前商用国产推理加速卡中,昇腾950核心竞争力突出。依托全新自研架构,它是国内唯一实现商用落地、原生支持FP4低精度推理的AI加速硬件。
FP4低精度推理技术的核心价值,在于通过极致压缩模型数据体积,降低显存占用、提升运行效率。同等硬件条件下,可承载更大规模、更复杂的大模型运行,同时兼顾提速与降本。公开参数对比显示,昇腾950单卡FP4算力为英伟达H20的2.87倍,且搭载华为自研国产高带宽内存(HBM),硬件自主化程度大幅提升。
搭载全新昇腾950PR处理器的AI训练推理加速卡Atlas 350。图据 新华网
放眼全球AI产业格局,英伟达CUDA生态长期构筑难以突破的行业壁垒,也是海外算力厂商的核心优势。DeepSeek-V4全面兼容适配昇腾950,可以视作着眼长远的生态布局。毕竟顶级开源大模型的深度适配与落地验证,将持续完善华为CANN算力生态,为后续逐步实现CUDA生态替代筑牢基础。
不过,现阶段V4仅确认实现了国产芯片部署运行,尚未明确是否全程依托昇腾950完成模型训练。从“国产芯片可部署”到“国产算力全流程训练”,仍是国产大模型产业链需要跨越的关键鸿沟。
DeepSeek启动首轮融资
破解人才与算力双重困局
在V4重磅更新前夕,DeepSeek传出重大战略变动。有报道称,DeepSeek近日启动首轮融资,正与少数战略投资者接触,可能把估值推高至200亿美元以上。
长期以来,DeepSeek始终坚持独立运营、拒绝外部资本注入,此番开放融资,标志着企业发展战略迎来关键转向。
DeepSeek背后的资金来源一直是幻方量化,一家管理规模超百亿的量化私募基金,创始人梁文锋同时也是DeepSeek的创始人。这种“自有资金驱动”的模式让DeepSeek在起步阶段保持了极高的独立性和决策效率。
但伴随大模型参数从百亿级跃升至万亿级别,算力采购、集群建设、高端人才招募的成本呈指数级上涨,单一私募机构的资金体量,已难以支撑长期高强度研发投入。
当前AI赛道竞争早已走向全维度比拼,图像、视频多模态理解能力,已成为ChatGPT、Gemini等主流模型的标配能力。而本次全新迭代的V4系列,依旧仅推出纯文本版本,未布局多模态功能。业内分析认为,多模态模型的训练需要消耗海量算力与多维度数据资源,资金与算力供给不足,或是V4缺席多模态赛道的核心原因。
不过,知情人士称,DeepSeek的自由现金流确实不如一些体量更大的竞争对手充裕,但公司眼下并没有迫切的大额外部融资需求,这轮融资的核心其实是稳定研究团队。
过去一年,一些竞争对手估值快速上升,DeepSeek已有部分研究人员离职投向对方。
加入小米MiMo大模型团队的罗福莉。 图据 界面新闻
比如,传了一年的“天才AI少女”罗福莉,被认为是DeepSeek-V2/V3核心贡献者,最终加入小米MiMo大模型团队;DeepSeekV1核心作者、公司元老王炳宣,在去年年底被传离开DeepSeek,终于在今年4月被证实;DeepSeekVL系统模型的核心作者阮翀,今年4月被元戎启行挖角担任首席科学家……
在AI研发领域,股权、期权是核心技术人员薪酬体系的核心组成,也是团队稳定的关键抓手,而长期未融资的DeepSeek,恰好缺少这一核心激励工具。
但引入外部资本也意味着DeepSeek将面临新的问题,如何在资本意志与技术独立性之间保持平衡?梁文锋此前反复强调的“不妥协”路线,在外部股东入局后是否还能维持?
目前谈判仍存在较大不确定性,最终是否达成交易以及具体估值仍未可知。
编辑 严心怡
校对 李怀英
审核 饶竹舟
【未经授权,严禁转载!联系电话028-86968276】
