Loading...

DeepSeek V4正式版7月中旬上线，大模型计费首次引入峰谷分时定价

AI资讯1天前发布 EdgeClaw

81 00

7月2日下午，大量开发者反馈DeepSeek网页对话和API出现全面异常，对话加载卡顿、长时间无回复、上传文档提示”服务器繁忙”，相关话题迅速登上热搜。就在同一天，DeepSeek官方在回应中确认了一个重要消息：V4正式版计划于7月中旬正式上线，并将同步落地API峰谷定价机制。

什么是峰谷定价

简单来说，就是按照使用时段区分价格。DeepSeek此次将一天划分为高峰和非高峰两个时段：高峰时段为北京时间每日9:00至12:00、14:00至18:00，合计7小时，覆盖了国内开发者和企业用户最核心的工作时间；其余时间，包括晚间、夜间、凌晨以及周末全天，均视为非高峰时段，价格维持不变。

以V4 Pro模型为例，非高峰时段百万Tokens输入（缓存命中）仅需0.025元，输入（缓存未命中）3元，输出6元。一旦进入高峰时段，价格直接翻倍——输入（缓存未命中）涨到6元，输出涨到12元。V4 Flash模型同样遵循这一规则，高峰时段缓存命中输入价格从0.02元升至0.04元，输出从2元升至4元。

DeepSeek V4正式版峰谷定价机制下的大模型算力调度示意图

为什么选择这个时间点

峰谷定价的推出并非偶然。据行业数据显示，DeepSeek近期用户规模短期激增66.7%，而算力扩容仅提升8.3%，高峰期并发压力远超服务器承载上限。这不是第一次出现问题——早在3月底就连续三天出现服务异常，最长宕机超过10小时。

通过价格杠杆来分流高峰算力，是云计算和基础设施领域常见的调度策略。DeepSeek将这套模式首次引入大模型API计费，标志着行业开始向电力等基础设施的精细化调度靠拢。官方明确表示，此举旨在”更合理地配置资源、提升服务稳定性”。

值得注意的是，V4正式版并未整体涨价。此前5月DeepSeek已将V4 Pro API从限时2.5折调整为永久降价，非高峰时段价格与永久降价后的预览版保持一致。峰谷定价相当于在工作高峰时段回调至降价前的原价水平。

API调用价格趋势对比图表展示高峰与非高峰时段差异

对开发者的实际影响

这一调整对不同业务场景的影响差异明显。高度依赖实时交互的业务，如在线客服机器人、代码辅助工具、高频Agent工作流，由于无法避开日间高峰时段，API调用成本将直接翻倍。而批处理任务、离线数据清洗、非实时内容生成等场景，开发者只需将任务调度到夜间或周末执行，就能削减近一半的API支出。

价格调整也放大了缓存命中的成本优势。以V4 Pro非高峰时段为例，缓存命中输入价0.025元与未命中输入价3元之间相差超过百倍。这将引导开发者更积极地优化Prompt结构，通过固定系统提示词、复用上下文等方式提高缓存命中率。

有开发者指出，高峰时段划分对国内用户不太友好，但对欧美时区用户来说，大部分调用时间反而落在谷时段。一位长期使用DeepSeek API的开发者则表示，即便高峰时段涨价至2倍，整体成本在行业中仍具有竞争力。

AI芯片底层算力支撑大模型推理架构的微距特写

大模型计费模式的新信号

DeepSeek的峰谷定价是大模型行业从粗放增长走向精细化运营的一个缩影。随着用户规模持续扩大、应用场景日趋复杂，单纯的”降价抢市场”策略正在让位于更可持续的商业模式。算力资源的有效调配、服务稳定性的保障、开发者成本的合理控制，三者之间的平衡将成为下一阶段竞争的关键变量。

对于正在使用或计划接入DeepSeek API的团队来说，现在就需要重新评估自己的调用模式和成本结构。错峰调度、缓存优化、模型选型——这些技术细节将直接影响运营成本。大模型的”电力时代”已经到来，学会在峰谷之间找到最优解，是每个开发者都需要面对的新课题。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

国产AI大比拼：豆包 vs DeepSeek vs Kimi，谁更适合日常用？

国产AI大比拼：豆包 vs DeepSeek vs Kimi，谁更适合日常用？

3个月前

6.9K0

斯坦福报告：阿里位列2025年AI贡献榜第三，中美顶级大模型差距实质性消除

斯坦福报告：阿里位列2025年AI贡献榜第三，中美顶级大模型差距实质性消除

2个月前

4.1K0

2026年AI编程工具新格局：本地Agent开源浪潮来袭

2026年AI编程工具新格局：本地Agent开源浪潮来袭

2个月前

3K0

GPT-5.5 Instant全面推送：幻觉率下降52.5%成最大亮点

GPT-5.5 Instant全面推送：幻觉率下降52.5%成最大亮点

2个月前

3.1K0