扫码查看

最好的开源模型！DeepSeek-V4正式上线，首轮融资估值超200亿美元

锦观新闻 2026-04-24 23:48 发表于四川

锦观新闻

2026-04-24 23:48

全文播报

发表于四川

距离DeepSeek-R1引爆全球市场，已经过去了15个月。

这一年多里，行业迭代节奏空前提速。ChatGPT从4.1版本持续更新至5.5版本，谷歌Gemini不断加码技术迭代；国内字节跳动、阿里、腾讯、智谱等头部企业，也发布或迭代了各自的模型。

唯独DeepSeek，除了去年底一次小幅版本迭代外，始终在低调观望。

2026年4月24日，这份沉默终于有了回响。

DeepSeek-V4正式上线

为当前最好的开源模型

4月24日，DeepSeek宣布，全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。

按照DeepSeek官方披露的信息，V4模型按大小分为Pro和Flash两个版本，也对应目前官方网页端和APP界面的专家模式和快速模式。其中Pro版本总参数为1.6万亿，激活参数为490亿，预训练数据规模33万亿；Flash版本总参数为2840亿，激活参数为130亿，预训练数据规模32万亿。

两款模型均标配百万字超长上下文窗口，在智能体（Agent）能力、世界知识储备、逻辑推理三大核心维度，达成国内水平与开源赛道的双重领先。

在具体性能上，两个版本的定位不同，V4-Pro性能比肩顶级闭源模型，而V4-Flash是更快捷高效的经济之选。

相比前代模型，V4-Pro的Agent能力显著增强。在Agentic Coding（智能体编程）评测中，V4-Pro达到当前开源模型最佳水平。

据悉，DeepSeek-V4已成为DeepSeek内部员工使用的Agentic Coding模型，据评测反馈使用体验优于Anthropic的Sonnet 4.5，交付质量接近Opus 4.6非思考模式，但仍与其思考模式存在一定差距。

在世界知识测评中，V4-Pro大幅领先其他开源模型，稍逊于顶尖闭源模型Gemini-Pro-3.1。在数学、STEM、竞赛型代码的测评中，V4-Pro超越当前所有已公开评测的开源模型，取得了比肩世界顶级闭源模型的成绩。

在推理上，官方在论文中表示，总体约落后前沿闭源模型3–6个月。Pro-Max（Max表示最大推理能力模式）推理扩展后在标准推理基准上优于OpenAI的GPT-5.2、谷歌Gemini-3.0-Pro，略逊于GPT-5.4、Gemini-3.1-Pro。

相比V4-Pro，V4-Flash在世界知识储备方面稍逊一筹，但展现出了接近的推理能力。而由于模型参数和激活更小，相较之下V4-Flash能够提供更加快捷、经济的API服务。在Agent测评中，V4-Flash在简单任务上与V4-Pro旗鼓相当，但在高难度任务上仍有差距。

深度绑定国产算力

全面适配昇腾950

本次DeepSeek-V4发布，行业最大关注点并非模型性能升级，而是其与国产算力生态的深度绑定。

4月24日模型发布当天，华为同步官宣：昇腾超节点全系列产品（A2、A3、950）全面支持DeepSeek-V4系列。据华为披露，基于V4-Pro模型，昇腾950超节点在8K输入场景下可实现TPOT约20ms、单卡Decode吞吐4700TPS；V4-Flash场景下TPOT约10ms、单卡吞吐1600TPS，算力调度效率突出。

另一边，DeepSeek在披露价格的同时，还在价格栏的小字中明确提到：受限于高端算力，目前DeepSeek-V4-Pro的服务吞吐十分有限，预计下半年昇腾950超节点批量上市后，Pro的价格会大幅下调。

这也意味着，DeepSeek-V4已完成对华为昇腾950国产AI芯片的原生适配，未来将依托国产算力底座，实现大模型调用成本的规模化下探。

作为华为2026年主力落地的新一代AI芯片，昇腾950聚焦万亿级大模型训练与推理场景，是昇腾910系列的全面迭代升级产品。IDC发布的2026年4月行业数据显示，2025年华为昇腾稳居国产AI芯片出货量榜首，业内普遍预判，2026年昇腾950系列将持续领跑国内商用AI芯片市场。

华为生态合作方业内人士评价，在当前商用国产推理加速卡中，昇腾950核心竞争力突出。依托全新自研架构，它是国内唯一实现商用落地、原生支持FP4低精度推理的AI加速硬件。

FP4低精度推理技术的核心价值，在于通过极致压缩模型数据体积，降低显存占用、提升运行效率。同等硬件条件下，可承载更大规模、更复杂的大模型运行，同时兼顾提速与降本。公开参数对比显示，昇腾950单卡FP4算力为英伟达H20的2.87倍，且搭载华为自研国产高带宽内存（HBM），硬件自主化程度大幅提升。

搭载全新昇腾950PR处理器的AI训练推理加速卡Atlas 350。图据新华网

放眼全球AI产业格局，英伟达CUDA生态长期构筑难以突破的行业壁垒，也是海外算力厂商的核心优势。DeepSeek-V4全面兼容适配昇腾950，可以视作着眼长远的生态布局。毕竟顶级开源大模型的深度适配与落地验证，将持续完善华为CANN算力生态，为后续逐步实现CUDA生态替代筑牢基础。

不过，现阶段V4仅确认实现了国产芯片部署运行，尚未明确是否全程依托昇腾950完成模型训练。从“国产芯片可部署”到“国产算力全流程训练”，仍是国产大模型产业链需要跨越的关键鸿沟。

DeepSeek启动首轮融资

破解人才与算力双重困局

在V4重磅更新前夕，DeepSeek传出重大战略变动。有报道称，DeepSeek近日启动首轮融资，正与少数战略投资者接触，可能把估值推高至200亿美元以上。

长期以来，DeepSeek始终坚持独立运营、拒绝外部资本注入，此番开放融资，标志着企业发展战略迎来关键转向。

DeepSeek背后的资金来源一直是幻方量化，一家管理规模超百亿的量化私募基金，创始人梁文锋同时也是DeepSeek的创始人。这种“自有资金驱动”的模式让DeepSeek在起步阶段保持了极高的独立性和决策效率。

但伴随大模型参数从百亿级跃升至万亿级别，算力采购、集群建设、高端人才招募的成本呈指数级上涨，单一私募机构的资金体量，已难以支撑长期高强度研发投入。

当前AI赛道竞争早已走向全维度比拼，图像、视频多模态理解能力，已成为ChatGPT、Gemini等主流模型的标配能力。而本次全新迭代的V4系列，依旧仅推出纯文本版本，未布局多模态功能。业内分析认为，多模态模型的训练需要消耗海量算力与多维度数据资源，资金与算力供给不足，或是V4缺席多模态赛道的核心原因。

不过，知情人士称，DeepSeek的自由现金流确实不如一些体量更大的竞争对手充裕，但公司眼下并没有迫切的大额外部融资需求，这轮融资的核心其实是稳定研究团队。

过去一年，一些竞争对手估值快速上升，DeepSeek已有部分研究人员离职投向对方。

加入小米MiMo大模型团队的罗福莉。图据界面新闻

比如，传了一年的“天才AI少女”罗福莉，被认为是DeepSeek-V2/V3核心贡献者，最终加入小米MiMo大模型团队；DeepSeekV1核心作者、公司元老王炳宣，在去年年底被传离开DeepSeek，终于在今年4月被证实；DeepSeekVL系统模型的核心作者阮翀，今年4月被元戎启行挖角担任首席科学家……

在AI研发领域，股权、期权是核心技术人员薪酬体系的核心组成，也是团队稳定的关键抓手，而长期未融资的DeepSeek，恰好缺少这一核心激励工具。

但引入外部资本也意味着DeepSeek将面临新的问题，如何在资本意志与技术独立性之间保持平衡？梁文锋此前反复强调的“不妥协”路线，在外部股东入局后是否还能维持？

目前谈判仍存在较大不确定性，最终是否达成交易以及具体估值仍未可知。

编辑严心怡

校对李怀英

审核饶竹舟

【未经授权，严禁转载！联系电话028-86968276】

打开川观新闻，阅读全文

精彩评论 0

查看更多评论

我要评论

关于我们 \| 广告业务 \| 联系我们
四川日报社版权所有未经书面授权不得复制或建立镜像 Copyright ©2011-2019 SICHUAN DAILY All rights reserved. 四川日报报业集团四川日报网蜀ICP备12028253号-2
互联网新闻信息服务许可证：51120170001
川观新闻跟帖评论自律管理承诺书

最好的开源模型！DeepSeek-V4正式上线，首轮融资估值超200亿美元

精彩评论 0

精彩评论

小观推荐

关注我们