Google Gemma 4开源:手机本地运行,功耗降低60%

AI资讯2周前发布 EdgeClaw
1.2K 00

谷歌于5月4日正式发布Gemma 4全系列模型,涵盖E2B、E4B、26B MoE及31B Dense四个版本。这是谷歌首次采用Apache 2.0许可证发布开源模型,被誉为史上最大开放权重突破。更令人惊叹的是,E2B/E4B模型可直接在手机本地运行,功耗较同类产品降低60%。

Apache 2.0许可:真正的开源精神

与以往”开源即限制”的发布不同,Gemma 4采用Apache 2.0许可证,这意味着任何人都可以自由使用、修改、分发甚至商业化这些模型。这一举动被开源社区视为谷歌向”真正的开源精神”靠拢的重要信号。

Gemma 4开源主视觉图:展示订阅服务界面和定价方案

在此之前,Meta的Llama系列是开源大模型的主力军,但其在商业使用上仍有诸多限制。谷歌此次选择Apache 2.0许可,显然是希望在开源大模型市场与Meta正面竞争。

手机端运行:端侧AI的新纪元

Gemma 4最令人瞩目的特性是E2B/E4B模型的手机端运行能力。通过激进的量化优化,这些模型可以在功耗降低60%的情况下保持可用的推理性能。这意味着未来的智能手机将能够在本地运行参数规模超过20亿的大语言模型。

Gemma 4开源数据可视化:呈现用户增长和成本结构分析

对于普通用户而言,这带来几个显著变化:响应速度更快(无需网络往返)、隐私保护更强(数据不上传)、使用成本更低(不消耗云端算力)。

性能表现:31B Dense跻身前三

Gemma 4系列中参数规模最大的31B Dense模型,在主流开源模型榜单中排名第三,仅次于部分更大规模的闭源模型。这一成绩证明了谷歌在模型架构优化上的深厚功底。

Gemma 4开源场景展示:演示不同订阅层级的功能差异

Hugging Face同步上线了Gemma 4全系列量化模型文件,覆盖Q2_K至Q6_K多种精度,方便开发者在Ollama、LM Studio等本地化工具中部署。这将进一步加速开源大模型的普惠化进程。

当最强的开源模型能够在掌心运行,AI普惠化的最后一公里正在被逐一打通。

© 版权声明

相关文章