2026年6月27日,国内AI企业深度求索(DeepSeek)联合北京大学重磅推出全新推理加速技术DSpark,并在arXiv预印本平台公开完整论文与开源代码。这一技术并非新型大模型,而是一套颠覆性的推理加速框架,主打真实可用、落地性极强的工程级提速优化。
DSpark技术基于推测解码(Speculative Decoding)原理,通过创新的置信度调度机制和半自回归生成策略,在原有DeepSeek-V4-Pro、DeepSeek-V4-Flash模型基础上实现了跨越式性能提升。该框架的核心优势在于:在完全不损失输出质量的前提下,大幅缩短模型推理时间。

从实测数据来看,DSpark已全面上线DeepSeek官方服务,替换了此前成熟的MTP-1技术基线。在真实用户流量和同等服务器算力条件下,DeepSeek-V4-Flash版本生成速度暴涨60%至85%,DeepSeek-V4-Pro版本生成速度提升57%至78%。这一数据意味着,用户等待AI响应的时间将缩短近一半到三分之二。

在权威基准测试中,适配通义千问系列模型后,DSpark的有效生成长度比全球主流Eagle3技术高出26.7%至30.9%,比顶级DFlash并行技术高出16.3%至18.4%。测试覆盖数学推理、代码生成、日常对话等九大核心场景,性能提升全场景通杀、无短板领先。

行业分析认为,DSpark的发布对国产AI生态意义重大。一方面,该技术可兼容Qwen、Gemma等主流模型,中小开发者无需更换模型即可享受加速红利;另一方面,纯软件实现的特性使其无需额外硬件加装,降低了部署门槛。随着大模型应用进入深水区,推理效率将成为决定商业化成败的关键因素,DSpark的出现恰逢其时。
© 版权声明
文章版权归作者所有,未经允许请勿转载。







