近来,词元(Token)一词持续刷屏科技圈、经济圈,而让它“破圈”的,是一组极具冲击力的数据——今年3月,我国日均词元调用量突破140万亿。从2024年初的1000亿,到2025年底的100万亿,再到如今的140万亿,两年间增长超千倍。

这组跳跃式增长的数据,不仅让词元这一专业术语走进大众视野,更折射出我国人工智能产业的蓬勃脉动。

不少人疑惑,词元究竟是什么?

词元,是大模型处理信息的“最小信息单元”,如果说我们读书写字以“字”为单位,那么AI处理数据时,就会先将数据拆解成一个个可处理的词元,它可以是单个汉字、标点符号,也可以是一个词语片段。我们每一次向AI提问、使用AI生成内容,都是在调用词元。

日均140万亿的调用量,藏着中国人工智能发展的哪些信号?

信号一:这是人工智能应用活跃度的“晴雨表”,彰显了需求侧的澎湃活力。

词元调用量越高,说明人工智能被使用得越广泛、越频繁,反映人工智能技术走进大众生活、赋能千行百业的深度与广度。

如今,AI已渗透到我们生活的方方面面:教师用AI辅助备课提质增效,农民用AI诊断病虫害守护收成,小微企业用AI优化供应链降低成本,普通用户用AI处理文案、编辑图片……从“点亮”日常生活到深度赋能产业,从文本生成到智能体的广泛应用,AI越来越好用,带动词元调用量持续攀升。这背后,是亿万用户与万千企业对AI技术的认可,更离不开我国日益成熟的人工智能应用生态。

信号二:这是人工智能产业商业化的“破局信号”,反映了供给侧的创新动能。

词元的每一次调用,离不开算力的消耗、算法的运转和电力的投入。

比如,算力越强,词元处理速度越快、单位成本越低;算法越优,模型生成的内容质量越高、词元调用频次越高;电力供给越稳定、成本越低,词元的生产与调用成本也会降低,甚至能让中国的绿电以词元形式实现价值出海……在人工智能产业链上,各环节成本与效率的竞争力都能通过词元来进行衡量,故而词元也被视为智能时代的价值锚点。

这种全链条的价值评估能力,加上词元本身所具备的可计量、可定价、可交易的特征,使其成为连接技术供给与商业需求的“结算单位”,让人工智能产业的商业化路径愈发清晰——就像我们按流量付费使用网络,未来人工智能服务也可以实现“按词元计费”,从而进一步推动人工智能技术转化落地,成为数字经济新的增长引擎。

信号三:这是数据要素价值释放的“重要标志”,体现了政策举措的持续加力。

如国家数据局局长刘烈宏所言,我国日均词元调用量的大幅增长表明,随着中国数据要素市场化配置改革的纵深推进,人工智能高质量数据的供给体系正在形成,“数据供给—价值释放”的良性循环已初现端倪。

人工智能的发展离不开数据的支撑,而词元的海量调用,背后是高质量数据集的持续扩容——截至2025年底,我国已建成高质量数据集超10万个,总体量超890PB,数据通过拆解为词元被AI处理、应用,最终转化为生产力,为模型迭代、应用落地提供了坚实支撑。

一个个跳动的数字背后,是技术的迭代、应用的深化,更是产业的跃迁。随着人工智能技术的加速进化、智能经济新形态的茁壮成长,日均词元调用量还将一步步地跃上多高的台阶?让我们共同期待。

本期责编:林丽鹂、王东辉