百度文心5.1重磅发布：预训练成本仅需业界6%，LMArena搜索榜登顶全球前列

5月9日，百度正式发布新一代基础大模型「文心大模型5.1」，在预训练成本仅为同级别业界模型约6%的前提下，基础性能实现行业领先，并在LMArena搜索榜登顶国内第一、全球前列。这一技术突破标志着国产大模型正式迈入「高效低耗」的新阶段。

自研「多维弹性预训练」技术，成本骤降94%

文心大模型5.1最大的技术亮点在于采用了百度自研的「多维弹性预训练」架构。传统大模型预训练需要消耗海量算力资源，成本动辄数百万美元起步。而百度通过动态稀疏激活、知识蒸馏压缩、课程学习调度三项核心技术的协同优化，将同等规模模型的预训练成本压缩至业界平均水平的6%左右。

这一突破意味着什么？中小企业和研究机构也能以更低门槛获取顶级AI能力。百度同步宣布该模型已在千帆模型广场、文心一言官网开放体验，面向企业用户与开发者提供API调用服务。

在LMArena最新一期评测中，文心大模型5.1以综合得分登顶国内第一、全球前列，其中搜索问答、知识推理、长文本理解三项核心指标均刷新国产模型最高纪录。尤其在中文语境下的复杂问题拆解与多轮对话一致性方面，表现尤为突出。

百度方面表示，这得益于新模型在预训练阶段引入了更大比例的中文语料高质量清洗与强化学习对齐，使其更懂中文表达的隐含意图与知识边界。

技术领先之外，文心大模型5.1的发布也承担着百度AI商业化的战略使命。目前千帆平台已接入超过100家第三方模型服务商，文心5.1将作为底座模型向企业客户提供私有化部署、定制微调等增值服务。

在C端侧，百度正推动文心一言从「对话助手」向「生产力工具」转型。新版本强化了代码生成、文档摘要、多模态理解等高价值场景的实际可用性，剑指GPT-4在国内市场的替代份额。

业内分析认为，百度此次以「成本优势+性能领先」双轮驱动，有望在B端市场掀起新一轮大模型替代浪潮。随着国产大模型综合竞争力的持续提升，「百模大战」正从参数规模竞赛转向实际落地能力的较量。

文章版权归作者所有，未经允许请勿转载。

1周前

7200

7天前

5250

5天前

4890

1周前

5940