川观智库研究员 黄爱林

AI算力芯片领域正经历一场“大洗牌”。随着英伟达以200亿美元与AI芯片初创公司Groq达成合作,OpenAI签署超100亿美元Cerebras订单等重磅交易落地,市场格局已从单纯的“GPU霸权”演变为GPU与TPU竞逐。尤其是Meta采购谷歌TPU的传闻引发行业热议,TPU正打破内部专用局限,走向商用市场,或将成为挑战英伟达统治地位的关键力量。

GPU和TPU都是算力芯片,但是二者架构不同。GPU是多线程单一指令的架构。可以将其比作一个全能建筑队,凭借CUDA生态的深厚积累,什么活都能接,但在处理海量AI计算时,数据需要在显存和计算单元间频繁搬运,形成巨大的能耗黑洞。TPU采用脉动阵列架构,其核心是矩阵计算。更像一条高度优化的流水线,专为张量运算定制,在处理深度学习特定任务时效率极高,但在通用性上不及GPU。

川观智库通过梳理公开报道和播客访谈发现,在当前的技术节点下,两者在不同维度各占优势。GPU在单芯片性能与生态上占优,仍是市场首选的通用计算平台。TPU在能效比与集群系统上占优,训练超大模型时展现出极高的系统级性价比与能效优势。

AI算力芯片竞争将呈现两大趋势:一是集群化与系统化。单芯片性能竞赛已转向系统级较量。TPU通过大规模集群弥补单芯片短板,而英伟达也在强化NVLink等互连技术,提升整体系统吞吐;二是架构重构与“高阶TPU”崛起。以Cerebras、Groq(均为美国AI芯片设计公司)为代表的“高阶TPU”或可重构数据流芯片异军突起。它们打破了传统GPU的通用架构和TPU的固定架构,通过晶圆级系统或极低延迟推理,探索算力效率的极限。

对国产芯片而言,这场变局既是挑战也是机遇。清微智能等国内企业正在“可重构数据流架构”上发力,探索自己的底层创新之路。毕竟,在算力世界的单极时代终结之后,跟随者只能分得残羹,唯有在架构上差异化,才有资格进入下一轮全球竞赛。