Loading...

热门

企业AI账单暴涨300%：当智能体从省钱工具变成烧钱怪兽

AI资讯2小时前发布 EdgeClaw

78 00

2026年6月，全球企业管理层正面临一个始料未及的困境：年初还被视为降本增效利器的AI智能体，正以惊人的速度吞噬着公司预算。

优步成为最典型的案例。这家全球出行巨头在4月就用光了2026年全年AI预算，被迫紧急出台限制措施——每位员工在单个AI工具上的月度Token支出上限为1500美元。优步首席运营官安德鲁·麦克唐纳公开承认，AI Token支出变得”越来越难证明划算”，因为这些消耗无法直接对应到”多交付了多少消费者功能”。

等距3D风格插画展示企业AI账单不断攀升的场景，传达成本压力

这不是个例。沃尔玛全球首席技术官苏雷什·库马尔透露，公司内部AI编程工具Code Puppy的使用量暴增，现在要求员工先评估任务是否真正需要AI介入，而不是默认启动智能体。软件公司Workato的经历更加戏剧性：1300名员工开始使用AI智能体后，当Anthropic在5月切换到Token计费模式的第一天，公司AI支出就暴涨到原来的7倍。

从”随便用”到”精打细算”

这种转变的根源在于AI工具的形态升级。去年的AI使用场景主要是简单的文本生成和问答，成本可控。但2026年，企业全面转向AI智能体——这些智能体能够连续执行复杂任务、跨系统操作、自主规划工作流，代价是算力消耗呈几何级数增长。

Workato首席信息官卡特·布斯做了一个决定：把每周两次的AI推广培训，改成了”省钱培训”。他要求员工更多使用Anthropic较旧、较便宜的模型，而不是默认调用最新的旗舰模型。这个细节折射出整个行业的焦虑——当AI从辅助工具变成核心生产力工具，成本控制就成了企业生存的关键课题。

玻璃拟态仪表盘显示AI工具用量和成本曲线的数据分析界面

成本失控的三个核心推手

第一个推手是Token计费的全面铺开。2025年之前，多数AI服务采用固定订阅制，企业每月支付固定费用即可不限使用。进入2026年，OpenAI、Anthropic、Google相继切换到按Token计费模式，每一次查询、每一个自动化流程都有明确的成本标签。

第二个推手是智能体的连锁调用。一个看似简单的任务——比如”帮我分析上季度销售数据并生成报告”——可能触发数十次模型调用：数据提取一次、清洗一次、分析一次、图表生成一次、文字撰写一次。每次调用都消耗Token，而用户只看到一个最终结果。

第三个推手是”用得多不等于用得好”的错位。许多企业在部署AI时缺乏效果评估体系，员工使用AI的频率与产出质量之间没有建立关联。Workato在复盘后发现，约30%的AI调用产出的结果需要人工大幅修改，这些调用本质上是浪费。

暗黑科技风格漏斗结构展示从Token消耗到精细管控的转变过程

行业正在形成的应对策略

面对成本压力，头部企业已经摸索出一套管控方法。最核心的策略是”模型分级”：简单任务用便宜的小模型处理，只有真正需要深度推理的复杂任务才调用旗舰模型。谷歌内部将这套策略称为”模型路由器”，根据任务复杂度自动匹配最合适的模型。

第二个策略是建立内部Token预算体系。企业为不同部门设定月度Token额度，超出部分需要额外审批。这种做法虽然增加了管理成本，但有效遏制了无节制的AI使用。

第三个策略是推动AI使用培训。不是教员工”怎么用AI”，而是教员工”什么时候不该用AI”。当员工能够准确判断一个任务是否需要AI介入、应该用哪个模型、如何优化提示词以减少Token消耗时，成本自然会下降。

成本焦虑不会阻止AI扩张

尽管成本压力巨大，企业对AI的投入并没有收缩。微软、亚马逊、思科等科技巨头的AI预算同比仍在增长，只是增速放缓、使用更加精细化。真正的变化在于：企业从”不计成本拥抱AI”转向了”每一分AI投入都要看到回报”。

这种转变对AI行业的长远发展未必是坏事。当客户开始算细账，模型提供商就不得不持续优化性价比。DeepSeek最新推出的V4模型通过混合注意力机制，将百万Token场景下的推理成本降低了90%以上。行业正在迈向”按厘计价”的普惠时代，而企业成本焦虑正是推动这场效率革命的催化剂。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

2026年AI工具排行榜：ChatGPT、DeepSeek、Claude、Gemini谁更强？

2026年AI工具排行榜：ChatGPT、DeepSeek、Claude、Gemini谁更强？

2个月前

7.1K0

Walkie实测：本地AI语音转文字，职场人打字时间省80%

Walkie实测：本地AI语音转文字，职场人打字时间省80%

2个月前

3.5K0

Claude Fable 5被封杀后，OpenRouter推出Fusion API：多模型协作能否成为最优解？

Claude Fable 5被封杀后，OpenRouter推出Fusion API：多模型协作能否成为最优解？

5天前

4680

前DeepSeek核心成员操刀：小米MiMo-V2.5系列正式发布，四款模型全面开源

前DeepSeek核心成员操刀：小米MiMo-V2.5系列正式发布，四款模型全面开源

2个月前

3K0