中国工程院院士、鹏城实验室主任 高文

长期以来,全球集成电路产业依靠摩尔定律指引发展,以芯片几何尺寸为核心标准,实现每18个月性能翻倍、尺寸减半。如今摩尔定律已逼近物理极限,原有发展模式难以为继。针对行业变革,华为提出韬定律,为后摩尔时代集成电路发展划定新规则。韬定律涵盖四大核心要素:晶体管尺寸、电路连接方式与规格、芯片堆叠模式、系统级技术迭代,四大维度共同决定未来十至十五年芯片产业的演进方向。

当前我国集成电路产业在高端光刻机领域面临制约,但芯片几何尺寸仅是四大要素之一,只要在电路互联、芯片堆叠、系统架构三大板块持续攻关,就能对冲单一环节的短板,保障集成电路产业稳步发展,这也为国产算力硬件研发奠定了理论基础。

立足技术变革浪潮,国家统筹布局水网、新型电网、算力网、新一代通信网、城市地下管网、物流网六大骨干网络。按照规划,2026年六大网络将合计拉动7万亿元投资,其中算力网独占3万亿至4万亿元投资规模,是新基建的核心板块。人工智能发展离不开算力支撑,建设自主可控的全国一体化算力网,牢牢掌握算力主权,是我国数字产业发展的必然要求。

作为算力网建设的远期核心工程,ZPG计划是国家级规模化算力基础设施规划。Z代表10^{21}级算力,P代表10^{15}比特每秒的通信速率,G代表10^9瓦级电力保障。其中Z级算力等效于百万卡集群,规模是传统万卡集群的百倍。我国将建成10个GPT级大型算力枢纽,打造集超大算力、超高速互联、吉瓦级电力保障于一体的算力底座,全面支撑人工智能、科学计算等领域发展。

当下市面上多数算力平台,均搭建在传统TCP/IP协议的IP网络之上,仅能承担基础数据传输工作,并非真正意义上的算力网络。我国规划建设的新一代算力网,以计算总线为底层架构,专为计算任务设计,在智能计算场景下,运行传输效率较传统IP网络提升数百倍。此外,有观点认为ATM技术可适配算力网络,但ATM基于消息语义运行,而算力作业依赖内存语义,二者底层逻辑存在本质差异,同样无法满足大规模算力协同需求,基于计算总线的专用算力网,才是未来产业发展的核心底座。

依托全新技术架构,中国算力网拥有三大典型应用场景。其一为跨域大模型训练。当前大语言模型、多模态大模型训练往往需要百万张算力卡协同作业,单座算力中心最多可部署5万张算力卡,难以满足需求。算力网能够整合20余个大型算力节点,打破地域限制,实现跨域集群联合作业,突破单点算力上限。其二是落地AI for Science模式,赋能前沿科研与产业应用。国内科研机构、研发中心与大型算力枢纽地域分散,算力网可实现异地算力共享,广泛应用于基础科学研究、工业仿真、影视内容渲染等场景。其三是支撑隐私可信协同计算。针对政务、金融等领域数据“不出域、不泄露”的要求,算力网搭建安全运行环境,实现数据可用不可见,在保障数据安全的前提下完成多方协同计算。

参考电网百年迭代的发展历程,算力网建设是一项长期工程,整体分为三个发展阶段。目前我国正处于第一阶段:算力资源汇聚阶段。后续将逐步迈入第二阶段:算力任务可调度阶段。最终抵达第三阶段:计算任务全域协同阶段。届时算力网将如同电网一般,实现算力按需取用、全域普惠。

与此同时,算力网建设还面临四大现实挑战:核心算力供给不足、跨节点大带宽低时延通信难度大、异构算力调度与运维体系不完善、跨域计算的数据安全风险突出。多年来,鹏城实验室围绕四大挑战开展技术攻关、系统验证与项目落地,取得一系列实质性成果。

在核心算力研发方面,实验室持续迭代鹏城云脑系列算力集群。继鹏城云脑一、二投用后,鹏城云脑三正在研发建设中。鹏城云脑二搭载4096张算力卡,全部采用华为智算芯片及CPU;鹏城云脑三算力卡规模提升至2万张,芯片从华为910A升级为910C。该芯片综合性能与国际主流产品英伟达H100旗鼓相当。鹏城云脑三建成后,将积累成熟的万卡级集群建设经验,团队后续还将向十万卡级算力集群发起攻关,持续夯实国产算力根基。

针对通信连接难题,鹏城实验室采用多芯、空芯光纤技术,打造超宽带、低时延光传输系统,被称作“东数西算”的“算力特高压”。目前深圳至贵阳百T比特、千公里、万波光直连系统正在施工,这条总长1100公里的南部数据大通道,单链路带宽达100T,底层摒弃IP协议,采用WRDMA总线协议,实现光速直达。线路投用后,两地智算中心可高速联动,联合开展大模型训练,成为全国算力跨域直连的标杆工程,预计2027年正式建成并开展跨地域分布式训练、多集群联合作业。

算力调度领域,相关工作自2019年启动,历经多轮国家项目建设。截至2026年3月,相关平台已接入全国1448个算力设备,汇聚国内70%至80%的智能算力资源。这套全国一体化算力网监测调度平台,可对全国算力中心进行实时监控管理,为国家数据局开展行业监管提供支撑。同时,鹏城实验室研发异构算力资源封装、管理技术与配套软件,牵头参与全国一体化算力网络标准制定,不断完善算力调度体系。数据安全层面,实验室自研防水保技术,搭建数据审查、流转、可信计算一体化引擎,保障委托计算安全可控,筑牢数据安全防线。

在算力网与ZPG计划推进过程中,开源开放是贯穿始终的发展理念。依托新一代人工智能产业技术创新联盟,业内成立OpenI开源社区,同时联合启智社区开放算力、数据集、模型与训练环境。鹏城云脑完成7B、33B、200B等不同参数规模的国产大模型训练,并通过开源社区向国内外同步发布。开源生态大幅降低行业研发门槛,加速技术迭代,并为垂直领域应用赋能。

此外,面向国家战略科技力量的专用科研专网正在规划建设,为重大科技攻关提供专属支撑。在行业融合应用上,基于鹏城云脑打造的数字视网膜架构已迭代至第四代,该技术自2018年启动研发,融合算力网与全域感知网,可应用于交通管理、空中调度、全域安防等场景,实现算力、感知、智能深度融合,进一步拓宽算力网的应用边界。

后摩尔时代的技术变革、六大新型网络布局,为算力产业带来全新机遇。中国算力网作为JPG计划的先导工程,为国家级超大算力基础设施建设积累了宝贵经验,而ZPG计划将成为我国参与智能时代科技竞争的核心抓手。坚持开源开放,推动算力网与感知网融合发展,将持续释放数字经济动能。

未来,随着各项技术不断突破、重点项目陆续落地,一张算力充沛、网络通畅、安全可信、开放共享的全国一体化算力网,将全面赋能千行百业,为我国数字产业高质量发展注入持久动力。

(本报记者张一鸣整理)