1个月烧出5亿美元账单!
近来, 科技领域传出一件令人大跌眼镜的巨大差错。按照 Axios 的说法, 有一家公司, 在仅仅 1 个月这样短的时间之内, 居然在 Claude 上面突破了 5 亿美元!
其缘由让人啼笑皆非, 管理层于为员工去开通Claude账号权限之际, 竟然忘掉设定使用额度上限了。

其实,AI账单爆仓的远不止这一家。
今年4月, 有一名谷歌云用户, 其因公开服务里遗留的API key被滥用了, 原本仅有7美元预算的账户, 在一夜之间收到了1.8万美元的账单。

叫Jesse Davies的这个运气不佳的用户, 是澳大利亚的AI顾问, 也是Agentic Labs的创始人, 他为自己的Google Cloud账户打造了两项保障措施: 一项是约7美元即10澳元的预算预警, 另一项是1400美元的硬性消费限额。
按照Tom's Hardware的报道来讲, 攻击者察觉到了他在几个月之前于AI Studio所发布的一项Cloud Run服务 , 为之发送了6万多个请求 , 两道保险均未将其拦住 , 账单计算存在延迟 , 待系统作出反应的时候 , 金额已然飙升至1.8万美元。
5月中旬的时候, 开源项目OpenClaw的创始人Peter Steinberger, 在X上面贴出了一张截图, 这里显示着, 30天的时间, OpenAI API账单达到了130万美元。

他所在的团队仅仅只有三个人, 然而, 正是这三个人指挥的那100个Codex智能体在同时并行运行着, 在30天的时间里消耗掉了6030亿个Token, 并且产生了760万次请求。所幸的是, 那130万美元并不是由他自己来支付费用的。
今年2月, Steinberger加入了OpenAI, 那130万美元被视为一次内部实验。
他补充说, 测试要是不把Token成本纳入考量范围, AI编程能够达到的极限会是怎样的情况。他另外又讲, 这是当属Codex「Fast Mode」(高速档计费)所呈现出来的结果。在把它关闭以后, 费用大概是30万美元。
再更早一点的时候, Uber的CTO Praveen Neppalli Naga, 还曾向The Information予以认可, 公司在4月时, 就已把全年的Claude Code预算给用光了, 而他们的COO也对外宣称, AI成本逐步变得愈来愈「难以自圆其说」。
五亿, 一百三十万, 一万八千, 金额尽管在数量上相差好几个层级, 然而都指向同一个事实:
于智能体时代当中, 有着失控的密钥, 存在昼夜无休的智能体军团, 还有忘了设上限的账号, 而其中任何一个, 皆能够使得你的Token账单在一夜之间被刷爆。
AI账单为什么会爆仓?
答案主要藏在计费方式的变化里。
今年4月起, OpenAI的计费方式, 从包月计费, 开始转向按Token用量计费。
4月2日, Codex进行计费调整, 由原来按消息估算变更为按Token用量对齐, 其中输入、缓存输入、输出这三类Token需分开计算。4月23日, 此套规则被扩展至所有Enterprise、Edu、Health、Gov方案, 月费里那笔原先看不见的折扣被抽离去掉了。
紧随其后的GitHub, 刚刚官宣了这事儿: 所有Copilot套餐, 从2026年6月1日开始, 转向按用量来计费。旧的高级请求逻辑作废了, 要更换成AI额度, 按照输入Token、输出Token、缓存Token的实际消耗情况, 对照每个模型的API费率来进行结算。

GitHub官方解释了这么做的原因:
如今, 有一个速度很快的聊天提问, 还有一次要跑上好几个小时的自主编码任务, 用户为它们所花费的钱是同样额度, GitHub一直都在为那些执行重度任务的用户承担费用, 然而这样一种模式已然没办法持续下去了。
AI智能体崛起之前,聊天和补全成本差不多,月费兜得住。
智能体兴起之后, 一项任务能够持续运行几小时, 还能改动整个代码库, 重度使用者与轻度使用者的成本差异能够拉大到几个数量级, 月费制度在这样的差距面前, 直接崩溃了。
消息一出开云app官方最新下载地址,Reddit和X上一片哗然。
一位有着ID为JBusu的开发者将账单截图展露出来, 直接表明新定价简直就是荒谬至极存在, 原本按月花费28.12美元那样的开销幅度, 如果按照新制度的规定居然得支付746.01美元, 这位开发者已然做出退订的决定, 并表示就这个定价而言, 要是自己去租用云服务器价格都会显得更为便宜些。


另一位用户发的截图更为夸张, 费用从五十美元开始, 一路急剧飙升至三千美元, 他表示没想到定价竟会如此离谱, 还问「还有人会继续订阅吗? 」。

然而, 也存在部分精通Copilot的老用户站出来进行反驳, 这些极端账单大多是由那些vibe-coder(凭借感觉进行编码的人), 在不将烧Token当回事的情况下烧出来的, 这样的情况不一定能够代表正常使用状况。
有一位身为老用户的人, 于评论区留下这样的话语: “我一整天持续不断都在使用, 到每个月月底的时候, 基本上不会出现超额的状况, 极难让人去相信, 原来是存在有工作复杂程度方面的差异。”另外一位给出的表达更为直接: “存在着一些人, 他们想要的是那种全自动化的YOLO模式的开发方式, 要使得AI能够随意地运行。那么这种浪费若被去掉, 对于其他的人而言, 反而会变成一件有益的事情了。”。
有一点得明确, GitHub并未取消月费, 基础订阅费用不曾改变。真正出现变化的是额外用量、智能体任务以及更昂贵的模型调用, 自此步入用量计费阶段。
遭受冲击最为严重的, 是那些借助Copilot去运行长链任务的, 处于较高使用频率的智能体用户。
被自己人玩坏的排行榜
月费出现失守情况, 一方面平台对计费规则进行了更改, 另一方面使用 AI 的人群, 自身也在大肆耗费。
5月, Business Insider进行了报道, 报道传达了这样的情况, 即Amazon把一个名为KiroRank的内部AI使用的排行榜给下线了。
据该报道援引知情人士所言, 这个榜单暗暗催生出了一种怪异的工作方式, 部分员工, 为了能在榜单上攀升几位, 便会去刷一些不能解决实际问题的Token消耗, 全然仅是为了排名。

事情被曝光出来以后, Amazon的高级副总裁Dave Treadwell直接朝着全体人员大声呼喊着说: 「不要只是为了使用AI才去使用AI。要运用它去处理客户所面临的问题, 去解决业务所遇见的难题, 从而实现创新。」。
事情这般, 虽说略微有着几分荒唐, 然而却半分也不意外, 当“烧Token”这种行为能够登上榜单之时, 员工自然而然地就会去做烧Token这件事儿。
有一种现象, 在硅谷人们赋予了它一个专门的称呼, 叫做Tokenmaxxing(极限烧Token), 这是为何, 是把所谓消耗量认定为生产力。
Axios所做的报道当中也有提及, 存在CTO察觉到员工运用AI模型去查询天气情况, 以及撰写日常邮件, 如此极为简单的事情, 一旦套用上最为昂贵的前沿模型, 账单将会在悄无声息的状态下飞速上涨。
即便那KiroRank并非是由Amazon官方所构建的考核体系, 而是员工们凭借自身力量自发搭建起来的非正式工具罢了。然而它却清晰明了地曝露了一个经典的管理学方面的规律: 就在将KPI设置错误的那种状况之下, 那些人就会运用最为聪明的方式去钻空子, 以达成某种对自身有利的目的, 这是一种很值得去充分重视和深入探究从而避免的现象。
把「用了多少」, 视为「干得好不好」, 这正是这一轮, AI浪费的, 制度性根源。
算Token账的人,已经在赚钱
Token账单焦虑的另一面,有人悄悄把它做成了生意。
第一条路:用上下文喂饱AI。
Arvind自家公司正是Glean, 它所从事的是企业AI工作助手相关业务, 即将分散于公司各个地方的知识进行统一贯通, 使得员工的AI能够直接获取到上下文内容, 而无需再到处翻找, 由于AI减少了绕路情况, 那么所消耗的Token自然也就减少了。
这般机制致使Glean的年度营收, 在十五个月的时间跨度里, 实现了增长至三倍的情况, 成功跨越三亿美元, 其客户涵盖Databricks、Reddit、Samsung。
第二条路:把活分给对的模型。
有一家名为Factory AI的模型路由刚刚创立的公司, 所做的事情便是如此这般: 将每一项任务自动分派至最为合适的模型那里, 简单的任务经由便宜的档次去处理, 复杂的任务则借顶配来完成。Arvind也曾讲过这样的情况: 要是路由做得正确, 那么能够节省达10倍之多。
这两条路殊途同归:让AI干活,但别让它乱烧。
学术圈的研究,也在为这种转向奠基。

您提供的并非一个句子呀, 请您提供具体要改写的句子以便我按照要求进行操作。
有一篇于2026年4月出的arXiv论文, 其一首次系统地把智能体编码任务究竟怎样耗费资金的问题进行了拆解。
结果一来着, 智能体任务当中的Token消耗情况, 能够达到普通代码推理这事儿, 还能达到代码对话这事儿的上千倍之多, 而致使成本被拉高的主要原因在于输入 Tokens。
结论二:同一个任务跑多次开云app在线入口,开云真人官方下载,Token消耗能差出30倍。
有着这样一个结论叫结论三, 那就是更高水准的Token被消耗掉, 并不一定就会带来更高的准确程度。精准度通常是在处于中等成本的地方达到顶点, 要是再往上去消耗, 钱这样花出去了, 然而效果反而呈现出饱和的状态。
论文还发现, 前沿模型没办法做到预测自身要消耗的Token数量, 普遍会对真实成本进行低估。
你觉得花更多的钱便能够办更多的事, 然而事实上钱已经花出去了, 可事情却不一定能办得更好, 而且竟然连预算都没办法准确计算出来。
当AI账单开始赶超人力成本
「这是我记忆中第一次,技术成本开始和人力成本持平。」
在5月29日这一天, Glean公司的首席执行官是Arvind Jain, 而他是正在接受CNBC记者Deirdre Bosa的采访, 并且他是这般讲道的。

Bryan Catanzaro, 这位英伟达应用深度学习副总裁, 他的观察, 也证实了这一情况。
他于Axios访谈当中提及, 就他之团队而言, 算力成本已然远远超越员工薪资。
多家公司有正在浮现的类似现象, 做企业AI的Glean, 进行这般操作, 卖AI算力的英伟达, 也在做同样的事, 使用AI的Uber, 同样在重新审视这笔账。
在Arvind的认知里, 于历史范畴中, 技术于企业整体成本而言, 仅仅占据极小的一部分, 然而当下, AI成本已然能够与工资单相持平, 众多企业的年度AI预算, 往往在一到两个月的时间内便会被完全耗尽。

上一年, AI运用比率成了备受尊崇的衡量标准, 大量使用便堪称先进, 消耗Token就视作迎向未来。当下, 好多企业着手思索那句平实的话语, 那些被耗费的Token, 究竟换得了啥?
免费包月畅用的窗口期开云正版app下载开云app在线入口,恰恰正在此时关上。
接着, 呈现在全部开发者眼前的是这般一个问题, 即怎样精打细算, 以使每一个Token展现出最大价值。
未来真正的赢家,毫无疑问将是最先学会算Token账的那个。
参考资料:
https://x.com/dee_bosa/status/2060791500049613306%20
https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20
https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20
https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5
标签: AI成本 企业教训 Token计费 智能体使用 预算管理
还木有评论哦,快来抢沙发吧~