企业AI账单暴涨300%:当智能体从省钱工具变成烧钱怪兽

AI资讯2小时前发布 EdgeClaw
78 00

2026年6月,全球企业管理层正面临一个始料未及的困境:年初还被视为降本增效利器的AI智能体,正以惊人的速度吞噬着公司预算。

优步成为最典型的案例。这家全球出行巨头在4月就用光了2026年全年AI预算,被迫紧急出台限制措施——每位员工在单个AI工具上的月度Token支出上限为1500美元。优步首席运营官安德鲁·麦克唐纳公开承认,AI Token支出变得”越来越难证明划算”,因为这些消耗无法直接对应到”多交付了多少消费者功能”。

等距3D风格插画展示企业AI账单不断攀升的场景,传达成本压力

这不是个例。沃尔玛全球首席技术官苏雷什·库马尔透露,公司内部AI编程工具Code Puppy的使用量暴增,现在要求员工先评估任务是否真正需要AI介入,而不是默认启动智能体。软件公司Workato的经历更加戏剧性:1300名员工开始使用AI智能体后,当Anthropic在5月切换到Token计费模式的第一天,公司AI支出就暴涨到原来的7倍。

从”随便用”到”精打细算”

这种转变的根源在于AI工具的形态升级。去年的AI使用场景主要是简单的文本生成和问答,成本可控。但2026年,企业全面转向AI智能体——这些智能体能够连续执行复杂任务、跨系统操作、自主规划工作流,代价是算力消耗呈几何级数增长。

Workato首席信息官卡特·布斯做了一个决定:把每周两次的AI推广培训,改成了”省钱培训”。他要求员工更多使用Anthropic较旧、较便宜的模型,而不是默认调用最新的旗舰模型。这个细节折射出整个行业的焦虑——当AI从辅助工具变成核心生产力工具,成本控制就成了企业生存的关键课题。

玻璃拟态仪表盘显示AI工具用量和成本曲线的数据分析界面

成本失控的三个核心推手

第一个推手是Token计费的全面铺开。2025年之前,多数AI服务采用固定订阅制,企业每月支付固定费用即可不限使用。进入2026年,OpenAI、Anthropic、Google相继切换到按Token计费模式,每一次查询、每一个自动化流程都有明确的成本标签。

第二个推手是智能体的连锁调用。一个看似简单的任务——比如”帮我分析上季度销售数据并生成报告”——可能触发数十次模型调用:数据提取一次、清洗一次、分析一次、图表生成一次、文字撰写一次。每次调用都消耗Token,而用户只看到一个最终结果。

第三个推手是”用得多不等于用得好”的错位。许多企业在部署AI时缺乏效果评估体系,员工使用AI的频率与产出质量之间没有建立关联。Workato在复盘后发现,约30%的AI调用产出的结果需要人工大幅修改,这些调用本质上是浪费。

暗黑科技风格漏斗结构展示从Token消耗到精细管控的转变过程

行业正在形成的应对策略

面对成本压力,头部企业已经摸索出一套管控方法。最核心的策略是”模型分级”:简单任务用便宜的小模型处理,只有真正需要深度推理的复杂任务才调用旗舰模型。谷歌内部将这套策略称为”模型路由器”,根据任务复杂度自动匹配最合适的模型。

第二个策略是建立内部Token预算体系。企业为不同部门设定月度Token额度,超出部分需要额外审批。这种做法虽然增加了管理成本,但有效遏制了无节制的AI使用。

第三个策略是推动AI使用培训。不是教员工”怎么用AI”,而是教员工”什么时候不该用AI”。当员工能够准确判断一个任务是否需要AI介入、应该用哪个模型、如何优化提示词以减少Token消耗时,成本自然会下降。

成本焦虑不会阻止AI扩张

尽管成本压力巨大,企业对AI的投入并没有收缩。微软、亚马逊、思科等科技巨头的AI预算同比仍在增长,只是增速放缓、使用更加精细化。真正的变化在于:企业从”不计成本拥抱AI”转向了”每一分AI投入都要看到回报”。

这种转变对AI行业的长远发展未必是坏事。当客户开始算细账,模型提供商就不得不持续优化性价比。DeepSeek最新推出的V4模型通过混合注意力机制,将百万Token场景下的推理成本降低了90%以上。行业正在迈向”按厘计价”的普惠时代,而企业成本焦虑正是推动这场效率革命的催化剂。

© 版权声明

相关文章