DeepSeek V4正式版7月中旬上线,大模型计费首次引入峰谷分时定价

AI资讯1天前发布 EdgeClaw
81 00

7月2日下午,大量开发者反馈DeepSeek网页对话和API出现全面异常,对话加载卡顿、长时间无回复、上传文档提示”服务器繁忙”,相关话题迅速登上热搜。就在同一天,DeepSeek官方在回应中确认了一个重要消息:V4正式版计划于7月中旬正式上线,并将同步落地API峰谷定价机制。

什么是峰谷定价

简单来说,就是按照使用时段区分价格。DeepSeek此次将一天划分为高峰和非高峰两个时段:高峰时段为北京时间每日9:00至12:00、14:00至18:00,合计7小时,覆盖了国内开发者和企业用户最核心的工作时间;其余时间,包括晚间、夜间、凌晨以及周末全天,均视为非高峰时段,价格维持不变。

以V4 Pro模型为例,非高峰时段百万Tokens输入(缓存命中)仅需0.025元,输入(缓存未命中)3元,输出6元。一旦进入高峰时段,价格直接翻倍——输入(缓存未命中)涨到6元,输出涨到12元。V4 Flash模型同样遵循这一规则,高峰时段缓存命中输入价格从0.02元升至0.04元,输出从2元升至4元。

DeepSeek V4正式版峰谷定价机制下的大模型算力调度示意图

为什么选择这个时间点

峰谷定价的推出并非偶然。据行业数据显示,DeepSeek近期用户规模短期激增66.7%,而算力扩容仅提升8.3%,高峰期并发压力远超服务器承载上限。这不是第一次出现问题——早在3月底就连续三天出现服务异常,最长宕机超过10小时。

通过价格杠杆来分流高峰算力,是云计算和基础设施领域常见的调度策略。DeepSeek将这套模式首次引入大模型API计费,标志着行业开始向电力等基础设施的精细化调度靠拢。官方明确表示,此举旨在”更合理地配置资源、提升服务稳定性”。

值得注意的是,V4正式版并未整体涨价。此前5月DeepSeek已将V4 Pro API从限时2.5折调整为永久降价,非高峰时段价格与永久降价后的预览版保持一致。峰谷定价相当于在工作高峰时段回调至降价前的原价水平。

API调用价格趋势对比图表展示高峰与非高峰时段差异

对开发者的实际影响

这一调整对不同业务场景的影响差异明显。高度依赖实时交互的业务,如在线客服机器人、代码辅助工具、高频Agent工作流,由于无法避开日间高峰时段,API调用成本将直接翻倍。而批处理任务、离线数据清洗、非实时内容生成等场景,开发者只需将任务调度到夜间或周末执行,就能削减近一半的API支出。

价格调整也放大了缓存命中的成本优势。以V4 Pro非高峰时段为例,缓存命中输入价0.025元与未命中输入价3元之间相差超过百倍。这将引导开发者更积极地优化Prompt结构,通过固定系统提示词、复用上下文等方式提高缓存命中率。

有开发者指出,高峰时段划分对国内用户不太友好,但对欧美时区用户来说,大部分调用时间反而落在谷时段。一位长期使用DeepSeek API的开发者则表示,即便高峰时段涨价至2倍,整体成本在行业中仍具有竞争力。

AI芯片底层算力支撑大模型推理架构的微距特写

大模型计费模式的新信号

DeepSeek的峰谷定价是大模型行业从粗放增长走向精细化运营的一个缩影。随着用户规模持续扩大、应用场景日趋复杂,单纯的”降价抢市场”策略正在让位于更可持续的商业模式。算力资源的有效调配、服务稳定性的保障、开发者成本的合理控制,三者之间的平衡将成为下一阶段竞争的关键变量。

对于正在使用或计划接入DeepSeek API的团队来说,现在就需要重新评估自己的调用模式和成本结构。错峰调度、缓存优化、模型选型——这些技术细节将直接影响运营成本。大模型的”电力时代”已经到来,学会在峰谷之间找到最优解,是每个开发者都需要面对的新课题。

© 版权声明

相关文章