Google Gemma 4开源：手机本地运行，功耗降低60%

1.2K 00

谷歌于5月4日正式发布Gemma 4全系列模型，涵盖E2B、E4B、26B MoE及31B Dense四个版本。这是谷歌首次采用Apache 2.0许可证发布开源模型，被誉为史上最大开放权重突破。更令人惊叹的是，E2B/E4B模型可直接在手机本地运行，功耗较同类产品降低60%。

Apache 2.0许可：真正的开源精神

与以往”开源即限制”的发布不同，Gemma 4采用Apache 2.0许可证，这意味着任何人都可以自由使用、修改、分发甚至商业化这些模型。这一举动被开源社区视为谷歌向”真正的开源精神”靠拢的重要信号。

在此之前，Meta的Llama系列是开源大模型的主力军，但其在商业使用上仍有诸多限制。谷歌此次选择Apache 2.0许可，显然是希望在开源大模型市场与Meta正面竞争。

Gemma 4最令人瞩目的特性是E2B/E4B模型的手机端运行能力。通过激进的量化优化，这些模型可以在功耗降低60%的情况下保持可用的推理性能。这意味着未来的智能手机将能够在本地运行参数规模超过20亿的大语言模型。

对于普通用户而言，这带来几个显著变化：响应速度更快（无需网络往返）、隐私保护更强（数据不上传）、使用成本更低（不消耗云端算力）。

Gemma 4系列中参数规模最大的31B Dense模型，在主流开源模型榜单中排名第三，仅次于部分更大规模的闭源模型。这一成绩证明了谷歌在模型架构优化上的深厚功底。

Hugging Face同步上线了Gemma 4全系列量化模型文件，覆盖Q2_K至Q6_K多种精度，方便开发者在Ollama、LM Studio等本地化工具中部署。这将进一步加速开源大模型的普惠化进程。

当最强的开源模型能够在掌心运行，AI普惠化的最后一公里正在被逐一打通。

文章版权归作者所有，未经允许请勿转载。

1个月前

3.1K0

5天前

3810

4周前

1.6K0

5天前

4770