最近这段时间,“token工厂”一词在科技圈有点火。
事情的起因是,在不久前举办的美国英伟达公司年度GTC大会(GPU技术大会)上,英伟达创始人兼首席执行官黄仁勋表示,当前的行业竞争已从大模型时代发展到token产能时代,“未来的数据中心不再是存储文件的仓库,而是生产token的‘工厂’”。对相关企业来说,“计算能力等同于收入”。
“token工厂”是什么?科技圈这是又在玩什么新“黑话”?
要了解“token工厂”,首先得明白什么是token。
简单来说,token是人工智能(AI)世界里最小的语义单元,也即模型处理和生成信息的基本单位。它可以是一个词、一段代码,也可以是图像或视频中的一个像素区块。
和许多人想象的不同,AI其实既不识字,也听不懂人话。每当它需要理解人类的意图,需要先把信息切割成token,再生成它自己可以理解的数字信息,处理完成后再反向执行这一流程,合成人类能够理解的信息表达出来。不严谨地说,token有点像动画电影《神偷奶爸》流水线上的“小黄人”,观众虽然弄不清每一只小黄人具体在做什么,但却明确地知道,当一群小黄人聚在一起,奇迹就会发生。
理解token之后,就可以尝试理解“词元”了。
在不久前举办的中国发展高层论坛2026年年会上,中国国家数据局局长刘烈宏明确将Token称为“词元”,并将它定义为“结算单位”。对此,多位业内专家表示,这意味着,我国AI正在从能力布局迈向能力结算,从模型好不好,转向智能服务如何计量、如何定价、如何交易。
一个译名为什么会引起业界如此高的关注?
答案可以从两个方面拆解。
第一,观测层面。
数据显示,2024年初,中国日均词元调用量为1000亿;到2025年底,跃升至100万亿;到2026年3月,已突破140万亿,两年增长超过1000倍。日均超140万亿的词元调用量,相当于1000万亿个中文词汇,相当于250个中国国家图书馆的资源量。同时,中国AI大模型周调用量已连续多周领跑全球,且国产词元价格仅为海外同类产品的十几分之一。两组数据说明,词元不再只是技术术语,而成为AI商业化速度、应用深度和产业景气度的重要观测指标。
第二,计费层面。
词元作为最小的语义单元,天然就具备量化计算的属性。它就像工业时代的电、互联网时代的流量一样,是AI时代核算成本的新度量衡。过去,很多企业采购软件,买的是许可证、账号数和部署周期;如今,越来越多企业开始按照可调用、可核算、可复盘的智能服务量计费。这种标准化、精细化的结算方式,将使得AI服务的商业化路径变得清晰。
因此,真正值得重视的,不只是“词元”这个译名,更是一个新的计量系统。正如赛迪研究院人工智能研究中心副研究员钟新龙在其署名文章中所言,词元一词的诞生意味着,“人工智能开始被纳入更成熟的经济叙事”。
搞清楚token和词元之后,“token工厂”也就不难理解了。
如果我们将词元比作数字经济时代的“硬通货”,那么在既定的电力和空间资源约束下,数据中心拼的是产出词元的速度、质量和成本,每瓦特电力带来的词元吞吐量将替代传统的服务器数量、存储容量,成为决定数据中心竞争力的核心指标。
从这个意义上讲,数据中心的角色正在发生根本性转变。传统意义上的数据中心主要用于数据的静态存储和网络交换,可以被简单视作“电子仓库”;如今随着AI智能体的发展,数据中心正全面转变为持续吞吐海量数据并输出智能内容的“电子工厂”。本质上说,数据中心已经变成了一条“智能生产线”:输入的是电力、数据、模型和调度系统,输出的则是AI智能体的执行能力和行业场景中的实际生产率。
至此,真正值得关注的关键词“实际生产率”出现了。
根据AI的“工作流程”,人类说出一句话之后,模型要先把文本切分成词元,再把词元映射成编号,随后才能完成关联、推断和生成。由于切分规则不同,相同的信息会被不同的模型拆解为不同数量的词元,相应的,模型处理问题的速度、效率甚至结果也不会完全相同。因此,词元消耗量与模型智能程度并不能完全画等号,真正决定结果的,仍然是模型算法、数据质量、任务设计和提示组织方式。
换言之,未来的“token工厂”,比拼的并不只是词元调用能力,而是词元调用与使用的综合能力,这才是“token工厂”真实的竞争力。(作者:江子扬 来源:经济日报)
(责任编辑:符仲明)