AI账单暴涨,实际效益难言:谁在助推“Token通胀”?
100万亿,这个数字后面跟着14个零,虽然庞大,但可能还不到国人每日Token消耗量的一半。
到了2026年上半年,从科技中心中关村到硅谷,大公司茶水间的热门话题变成了“你今天花了多少Token?”这个数字可能高达几十万、几百万甚至几千万。对于旁边的外卖骑手来说,这听起来像是吹牛或者精神错乱,但事实上,他们聊的并非人民币,而是Token。
Token与实际货币之间存在巨大的数量差距,但Token数量的激增速度惊人。据报道,一家国外公司在为员工批量开通Anthropic的Claude企业版时,未能设置消费上限,导致一个月的账单高达5亿美元,折合人民币约34亿元。
在国内,近期米哈游也出现了类似情况。该公司《崩坏》系列技术团队负责人郑银河在2026年5月的阿里云峰会上透露,一名工程师在测试多Agent协作时,因未设置熔断机制,导致数十个智能体陷入循环调用,在短短13小时内消耗了200万元的Token。
尽管Token账单高企,但AI带来的实际效益却让许多人难以启齿。米哈游工程师耗费200万元Token的测试,其成本足以支付一个小型研发团队一个月的薪资,最终却只换来了一夜无产出的“AI摸鱼”。
或许,在这种情况下,企业里只有人力资源部门完成了裁员指标,而企业主则将节省下来的人力成本重新投入到AI建设和Token采购中。
Token的单位价值正在被稀释,消耗量呈指数级增长,投入与产出之间出现了错位。作为AI时代的通用货币,Token正显现出典型的通货膨胀特征,其疯狂程度甚至可能超过津巴布韦人民扛着麻袋买大米的窘境。
那么,究竟是谁在助推这场“Token通胀”?
01 从过度使用到限制使用
2026年上半年,硅谷流行着一种名为“Tokenmaxxing”的趋势,即最大化Token的使用量。大型科技公司甚至鼓励员工尽可能多地消耗Token,并将Token消耗量与KPI直接挂钩。
Meta内部设立了追踪8.5万名员工Token消耗的排行榜,并为消耗量高的员工授予“Token传说”、“缓存大师”等称号。亚马逊推出了内部AI使用排行榜“KiroRank”,将Token消耗数据纳入团队绩效考核。
英伟达CEO黄仁勋的言论更是火上浇油:“如果我的工程师消耗的Token价值达不到他们年薪的一半,我会深感忧虑。”
国内厂商也迅速跟进。腾讯于2026年3月启动了全员AI激励计划,为每位员工提供每年22万元的Token资源,覆盖Cursor、CodeBuddy等国内外多款工具,内部也曾出现Token消耗排行榜。
不出所料,这些公司的AI账单也随之失控。
仅仅30天,Meta员工就消耗了60.2万亿Token,成本超过1亿美元。Uber在短短4个月内耗尽了2026年全年的AI预算,管理层不得不紧急出台限额令,规定每位员工每月AI工具费用不得超过1500美元。亚马逊也开始实施严格的Token限额管理,高级副总裁Dave Treadwell甚至亲自出面呼吁“不要为了用AI而用AI”。
就在上个月,腾讯内部也下发了额度调整通知:全员Token配额大幅缩减,核心研发团队的月额度从宽松状态收紧至7000元,外包岗位的额度更是降至1000元。
从全员不设限使用到如今的限额管理,短短三个月内,情况发生了180度的转变。究其原因,无非是飙升的账单让即使是财力雄厚的科技巨头也感到压力巨大。
正如OpenAI CEO山姆·奥特曼近日在一个企业客户活动上所说:“今年年初,AI运行成本还不是一个被提及的问题,现在它突然变成了一个巨大的挑战。”
这背后是需求的爆炸式增长。国家数据局数据显示,2026年3月,中国日均Token调用量已超过140万亿,而2024年初仅为1000亿,两年内增长了千倍以上。
从全球范围来看,这种增长趋势尚未有放缓迹象。高盛近期发布的报告预测,到2030年,全球Token月消耗量将比2026年增长24倍,达到约120千万亿(120 quadrillion)Token/月,其中企业级智能体是主要的增长动力。
Token账单失控还带来了一个副作用。为了弥补AI的高昂成本,今年一季度,海外十几家科技巨头裁员超过4万人,程序员首当其冲;而在国内,“630”成为了许多互联网从业者的最后工作日。
在Meta,几乎已经没有人手动编写代码;在国内的头部科技大厂,新增代码中高达90%由AI生成。AI代码生成率的飙升直接导致了人员需求的下降,并引发了职场震荡。
02 Token账单暴涨之谜
账单费用由“用量”和“价格”两个因素决定。在这看似简单的公式背后,隐藏着两层不透明的推高逻辑,最终叠加形成了指数级的成本膨胀。
许多人存在一个误解:大模型的价格一直在下降,AI应该越来越便宜。然而,事实并非如此——价格持续下降的通常是通用轻量模型,而企业真正所需的编程、长上下文处理、复杂推理等高价值场景,其价格不仅没有下降,反而出现了逆势上涨。
Anthropic推出的安全增强版模型Fable 5,定价高达每百万Token输入10美元、输出50美元,是同期Opus系列的两倍。
国内的智谱AI也是一个典型例子。据天眼查数据显示,2026年一季度,智谱AI因新模型迭代连续三次上调核心API价格,累计涨幅达83%。其面向通用场景的GLM-4.7轻量模型,输入价格仅为2-4元/百万Token,输出价格为8-16元;但面向编程与Agent场景的GLM-5.2,输入价格上涨至8元,输出高达28元,两者价差最高可达4倍。
此外,腾讯云在2026年3月至4月经历了两次调价,混元HY 2.0 Instruct模型的输入价格涨幅高达463%;MiniMax核心模型的价格也上调了30%-50%。
与此同时,模型厂商的计费模式已从订阅制全面转向按量付费,厂商的收入直接与Token消耗量挂钩。这就形成了一个结构性矛盾:客户的目标是用最少的Token完成任务,而厂商的商业利益则天然倾向于让客户消耗更多的Token。
从实际数据来看,近期的Token消耗量增长并非线性,而是指数级的。
自2025年底以来,AI产业最核心的变化是从对话式AI向Agent(智能体)的跃迁。AI不再是简单的问答式交互,而是演变为自主规划、循环调用、多轮纠错的复杂流程,Token消耗也随之从线性增长转变为指数级膨胀。
Agent虽然能力强大,但据腾讯研究院分析,它隐藏着几类典型的低效消耗模式:
- **上下文陷阱:**智能体在每一步操作中都会重复携带历史对话、工具日志和文件内容,导致同一批信息被反复计费。
- **技能冗余:**对49个软件工程技能的基准测试显示,79.6%的技能对任务通过率没有实质性提升,却可能带来高达451%的Token开销增长。
- **多Agent的“沟通成本”:**当多个智能体协同工作时,它们会不断重复任务背景、结论和格式化的套话,每一次对话都意味着重复计费。
- **长任务的“熵增”:**任务链条越长,越容易出现偏差,而为了纠偏,就需要增加摘要、检查、回滚等机制,进一步推高消耗。
这些损耗并非简单的累加,而是相互叠加产生的乘积效应。一个复杂的多Agent任务,可能近一半的Token被用于内部协调、自我纠偏和重复读取,真正用于生成有效内容的比例并不高。对于缺乏技术能力的企业来说,这更是一笔难以清晰计算的糊涂账。
03 害怕落后的焦虑
如果说大模型厂商的产品和定价策略是外部的“阳谋”,那么企业内部的Token消费则是一场自上而下的“自我消耗”。
**担心错过AI变革浪潮的企业,纷纷不遗余力地拥抱AI。**这种压力自然会传递到每一位员工身上,尤其是在AI可能取代人工的阴影下,员工普遍将“会用AI、多用AI”视为一种安全感来源。
许多公司将AI代码生成率、工具使用时长纳入OKR考核,甚至上线全员可见的数据看板,以此倒逼员工增加Token消耗。明明可以通过搜索引擎或人工几秒钟就能完成的邮件回复、基础代码片段、常规数据查询,也要交给大模型处理一番——反正费用不是自己掏腰包,用得越多似乎越显得“拥抱变革”。
企业将Token消耗量与员工绩效挂钩,默认“AI使用量”等同于“价值创造”,并愿意为此支付高昂的账单。
有人认为这是历史的必然。历史上每一次通用技术革命,都经历了类似的阶段。蒸汽机刚发明时,工厂主计算发现其成本不如使用马匹;电灯刚商业化时,其成本远高于煤气灯。
然而,关键区别在于,电力消耗产出的是实实在在、可衡量的工厂效益,但Token换来的“智能”,到底创造了多少价值?目前来看,答案仍难以量化。
据晚点LatePost报道,一位互联网大厂的技术管理者透露,其部门20多人一个月消耗5万元Token,但回顾下来,并未沉淀出多少可落地的成果。这笔钱相当于10名实习生的月薪,化作无形的Token后,甚至连清晰的产出物都未能留下。
企业常常认为使用AI可以节省人力成本。但反常识的是,在许多基础场景中,使用AI的成本反而比人工更高。
国内一家人力资源服务商曾进行过测算:使用AI筛选并初步评估一份简历,Token及系统成本约为1.2元/份,而雇佣兼职人事处理的成本仅为0.8元/份。类似的情况在数据标注、基础文案撰写、简单客服问答等领域也普遍存在。
**AI还带来了更隐蔽的成本。**有软件公司的研发负责人反馈,引入AI编程工具后,初级开发人员的效率看似提升了,但高级工程师的代码评审工作量翻倍,线上故障的返工成本增加了30%以上。综合计算下来,反而不划算,而且员工也变得更加疲惫。
这正是Token经济最核心的矛盾所在:Token消耗与价值创造之间,从未存在线性关系。并非消耗的Token越多,产出的价值就越大;相反,很多时候消耗的增长恰恰源于无效的循环、冗余的架构和盲目的焦虑。
04 结语
回到最初的问题,谁在推动“Token通胀”?这并非某一家AI厂商的恶意营销,也不是个别员工的滥用浪费,而是我们所有人的集体行为。
从提供底层算力基础设施的GPU和存储供应商,到大模型架构固有的膨胀属性;从每一个担心错过AI浪潮而焦虑的企业,直至每一位害怕落伍的员工——所有人都共同推高了Token的消耗,推动了Token的贬值,也加剧了那本日益厚重的AI账单。
每个人都在助推Token的通胀,而每个人又在自身的推动力下步履维艰。
爱游戏体育围绕聚合更新资讯,助你畅玩无忧不断创新,回应用户的真实需求。
掌握最新游戏动态
精选多元化娱乐内容,满足不同玩家需求内容,爱游戏体育与你一同发现更多精彩。
深入解读游戏精髓
爱游戏体育科技有限公司自2013年成立以来,始终致力于为广大玩家提供最全面、最前沿的游戏资讯与深度内容。我们深知玩家对游戏的热爱与追求,因此不断整合热门游戏资讯、独家内容专题、详细玩法说明及实时更新动态,力求为每一位玩家带来极致的数字娱乐体验。
聚合更新资讯
- 最新游戏发布
- 热门游戏攻略
- 电竞赛事报道
- 游戏行业分析
- 玩家社区活动
- 游戏文化探索
- 虚拟现实游戏
- 独立游戏推荐
- 游戏硬件评测
- 未来游戏趋势
作者:玩家小李 爱游戏提供的攻略真的太详细了,让我这种手残党也能轻松通关,感谢!
爱游戏体育专注爱游戏官网,为用户提供专业可靠的体验。
围绕爱游戏,爱游戏体育持续打磨更优质的服务。
爱游戏体育深耕聚焦热门游戏,第一时间掌握最新动态领域,用心服务每一位用户。












评论 (3)
资深玩家
2024年5月15日我们始终秉持“玩家至上”的理念,深入挖掘游戏文化,分享独到见解,并与全球顶尖游戏开发者保持紧密合作,确保您能第一时间获取最权威、最准确的游戏信息。
资深玩家
2024年5月15日想了解更多深入内容专题,解读游戏精髓与玩法技巧相关内容,尽在爱游戏体育。
资深玩家
2024年5月15日爱游戏体育科技有限公司致力于为广大玩家提供最全面、最前沿的游戏资讯与深度内容,打造极致数字娱乐体验。我们相信,游戏不仅仅是娱乐,更是一种生活方式。
发表评论