周伯文

当前,全球人工智能(AI)竞争的焦点,已从对话生成能力转向解决实体产业中复杂系统性问题的效能。我国拥有完整工业体系、丰富应用场景和超大规模市场,为人工智能与实体经济深度融合提供了得天独厚的优势。特别是“人工智能+”行动的深入实施,为AI大规模应用落地提供了支持。

AI深度赋能千行百业的核心在于实现通专融合——通过通用能力的广度与专业逻辑的深度相结合,锻造出真正能解决硬核科学与产业难题的新型智能。

我国AI发展的“下半场”,关键不在于“谁的模型更会聊天”,而在于AI能否真正走进实验室与生产线,攻克其中的复杂推理与科学决策难题,进而赋能新型工业化、生物医药、新材料等国家战略领域。

构建科学智能的深层推理机制

科学发现作为对长链条、创造性推理能力的终极检验,正成为通专融合最前沿的“试炼场”。通专融合将推动AI从辅助科研的工具升级为驱动科学发现的引擎,进而成为攻克科学前沿难题、赋能产业升级的“革命的工具”。

然而,即便当下最前沿的大模型已展现出惊人的通用能力,但在严谨的科学领域仍面临“博而不精”的木桶效应。上海人工智能实验室近期联合来自10个不同领域的百位科学家进行测评,结果显示:前沿模型在通用科学常识上得分可达50分(满分100分),但在各类专业推理任务(如专项文献检索、具体实验方案设计)中,得分骤降至15—30分。

这种现象揭示了一个深层困境:擅长处理数据充足、定义明确任务的传统深度学习,难以应对科学发现中“未知的未知”。让通用大模型具备科学家的深邃洞察能力,是实现通专融合的核心。要让AI像专家一样学习,必须重构训练机制。实现这一目标,需实现三方面突破。

一是构建“导师制”的过程反馈机制。科学推理往往链条极长,传统的过程奖励模型依赖海量人工标注,成本高昂且难以规模化。如果采用自动化、高密度的反馈机制,就如同为模型配了一位即时指点的“导师”,让其在每一步推演中都能获得逻辑反馈,而非仅在终点看结果。这能确保模型在长程推理过程中“不迷路”。

二是激发“求知若渴”的主动探索欲。科学突破往往藏在那些被忽略的边缘地带。通过特殊算法,可以让模型在面对难题时始终保持“Stay Hungry, Stay Foolish(求知若渴,虚怀若愚)”的状态,主动尝试多种可能性,而非满足于已知最优解。

三是追求“条条大路通罗马”的解法多样性。标准强化学习往往以“奖励最大化”为单一目标,导致模型倾向于反复陷入同一种成功路径。但在科学实验中,通往真理的道路往往不止一条。通过机制创新,可以让模型具备提供多种方案的能力,这不仅会增加成功概率,更可能通过对不同路径的交叉验证,催生出全新科学假设。

推动“工具辅助”迈向“范式变革”

要实现上述三大突破,单靠模型自发演化远远不够,需要一套有组织的科研范式。为此,上海人工智能实验室提出了驱动通专融合的技术架构——“智者”SAGE。如果说以往的AI4S(人工智能驱动的科学研究)是单点突破的“加速器”,那么在SAGE架构引领下的AGI4S(通用人工智能驱动的科学研究)则是科研范式的系统性变革。

SAGE架构像一台“逻辑平衡仪”,能将通用智能的广博与科学机理的严谨精准对齐。AI4S阶段,AI主要作为工具,在特定环节(如蛋白质结构预测)发挥加速器作用;而AGI4S则要求AI具备自主性、跨领域整合能力和创造性。它不仅能帮助研究者产生跨领域的想法、判断假设价值,还能自主构建新工具或实现已有工具的创新性组合。在AI支撑下,研究者还可以更全面、交叉地审视研究对象,提升认知水平,进而提出更优质的科学问题等,形成良性迭代循环。

这种通专融合的效能,正从实验室走向能够“算清经济账”的产业深处。以电力现货市场智能报价为例,通用大模型虽能撰写行业报告,却难以在瞬息万变的电力现货市场给出精准报价。在风光发电预测、电价波动、机组物理约束等多变量耦合的极端场景下,差之毫厘,失之千里。在电力交易中,预测精度提升一个百分点,往往意味着数亿元的收益差。基于SAGE架构,可以将电力行业的物理约束与市场规则深度植入大模型。这使得AI不仅能理解政策文本,更能像资深交易员一样进行长链条数值推理。2025年,上海人工智能实验室研发的“书生·风乌”气象预报大模型部署至内蒙古电网的427个新能源场站,将实际发电量的预测精度提升了3.04%,仅此一项就帮助相关电厂降低了4226万元的运营成本。

值得强调的是,AGI4S的价值并非体现在单一维度,而是贯穿创新全链条的三个层面:在未知探索方面(“从0到1”),不断拓展科学发现的边界,帮助研究者触及那些人类尚未意识到的“未知的未知”;在共性技术方面(“从1到10”),将初步成果转化为可复用的技术载体,构建面向科学共同体的共性技术平台;在产业加速方面(“从10到100”),推动成熟成果直接嵌入产业链,压缩小试、中试周期,实现降本增效。从量子计算领域的中性原子排布算法,到生物医药领域的临床转化评估多智能体系统,这条“从0到1、从1到10、从10到100”的路径正在更多行业悄然铺开。

共建“人工智能+”创新联合体

在推动通专融合走向纵深、通往AGI4S的征程中,需要冷静思考和回答 “AGI4S前沿六问”:边界之问,即所有科学问题是否都能被人工智能解决?预测之问,即AI的预测能力是否全面超越现有计算方法?语言之问,即对于科学表征,如何超越自然语言?交叉之问,即AGI4S不仅在于AI与其他学科交叉,还能带来哪些新的融合?验证之问,即如何判断AI是否有能力实现重大科学发现?新科学之问,即AGI将如何辅助更多学科发展“精确”视角?这六问并非对AGI4S前景的犹疑,而是对其长期价值的清醒锚定:既需清醒认识到当下可能被高估的能力边界、预测可靠性与语言表征的局限,也要关注那些被低估的远方——尤其是交叉学科的涌现、验证机制的建立和新科学范式的形成。

此外,技术架构的突破还必须与产业需求深度咬合,方能转化为服务新质生产力的专业智能体。当前,上海人工智能实验室正积极探索“创新联合体”模式,将SAGE架构与行业真实场景紧密结合。

一是建立FDE(前沿部署工程师)机制,通过专业队伍将前沿AI能力快速、精准部署到具体科研与产业场景,打通从模型到应用的“最后一公里”。二是打造“高手+高手”协同模式,即科学领域与AI领域的顶尖科学家在同一张“作战图”上深度协作、并肩攻关。在这种双轮驱动的组织模式下,AI不是替代“人手”,而是放大“人智”,从而加快科学发现与产业创新的步伐。

与此同时,上海人工智能实验室基于SAGE架构打造了支撑AGI4S探索的基础设施,包括开源万亿参数的“书生”科学多模态大模型Intern-S1-Pro、“书生”科学发现平台Intern-Discovery等,同时联合行业龙头企业,将行业机理知识安全地注入底座,在真实场景中进行压力测试,让理论在实践中完成闭环。

为建设“AGI4S试验田”,上海人工智能实验室将开源代码,发布技术白皮书,提供算力、数据支撑,与各方围绕科学发现中的长链条推理难题开展联合攻关;也期待与产业龙头共同开发垂直领域专业模型与智能体,与地方共建标杆示范,将通专融合能力深度植入行业场景,以前沿技术赋能新质生产力。

(作者系上海人工智能实验室主任、首席科学家)