Gemma 4 發布:Apache 2.0 開源,31B 模型全球開源第 3 名,支援 256K 上下文與音頻輸入
發布日期
2026 年 4 月 2 日,Google DeepMind 正式發布 Gemma 4。
基於 Gemini 3 同等研究基礎構建,Apache 2.0 授權(完全商業可用)。
自第一代 Gemma 推出以來,開發者已下載超過 4 億次,形成超過 10 萬個衍生版本的 Gemmaverse 社群。
四個版本
| 版本 | 類型 | 目標硬體 | 特點 |
|---|---|---|---|
| E2B | 邊緣模型 | 手機、IoT | 含音頻輸入、128K context |
| E4B | 邊緣模型 | 手機、樹莓派、Jetson | 含音頻輸入、128K context |
| 26B MoE | 混合專家 | 消費級 GPU | 推理時僅啟動 3.8B 參數,延遲極低 |
| 31B Dense | 稠密模型 | 單張 H100 80GB | 原始品質最高,適合 fine-tune |
性能排名
- 31B Dense:Arena AI 開源模型排行榜 第 3 名(LMArena 分數 1452)
- 26B MoE:排行榜 第 6 名(LMArena 分數 1441,僅用 4B 活躍參數)
- 能擊敗 20 倍大小的其他模型
核心能力
推理與 Agent
- 多步驟規劃與深層邏輯
- 原生支援 Function Calling、結構化 JSON 輸出、System Instructions
- 可建構與工具/API 互動的自主 Agent
多模態
- 所有版本:原生處理圖像和影片(可變解析度),支援 OCR、圖表理解
- E2B/E4B:額外支援音頻輸入(語音辨識)
長上下文
- 邊緣模型:128K context window
- 大型模型:256K context window(可一次傳入整個 repo)
語言支援
- 原生訓練超過 140 種語言
程式碼
- 高品質離線程式碼生成,可作為本地 AI 程式碼助手
硬體支援
- 手機:Android(透過 AICore Developer Preview,與 Pixel 團隊合作)
- 行動晶片:Qualcomm Technologies、MediaTek
- 邊緣裝置:樹莓派、NVIDIA Jetson Orin Nano
- 消費級 GPU:量化版本,本機運行
- 工作站/伺服器:單張 NVIDIA H100 80GB(bfloat16 全精度)
授權
Apache 2.0(完全開源,商業可用),可自由部署於本地或雲端環境。
延伸資源
- 官方模型卡:ai.google.dev/gemma/docs/core/model_card_4
- HuggingFace:gg-hf-gg/gemma-4-31B-it、gemma-4-26B-A4B-it、gemma-4-E4B-it、gemma-4-E2B-it