Allen 知識庫

載入中...

Gemma 4 發布：Apache 2.0 開源，31B 模型全球開源第 3 名，支援 256K 上下文與音頻輸入 | Allen 知識庫 | Allen 知識庫

Allen 知識庫

Gemma 4 發布：Apache 2.0 開源，31B 模型全球開源第 3 名，支援 256K 上下文與音頻輸入

發布日期

2026 年 4 月 2 日，Google DeepMind 正式發布 Gemma 4。

基於 Gemini 3 同等研究基礎構建，Apache 2.0 授權（完全商業可用）。

自第一代 Gemma 推出以來，開發者已下載超過 4 億次，形成超過 10 萬個衍生版本的 Gemmaverse 社群。

四個版本

版本	類型	目標硬體	特點
E2B	邊緣模型	手機、IoT	含音頻輸入、128K context
E4B	邊緣模型	手機、樹莓派、Jetson	含音頻輸入、128K context
26B MoE	混合專家	消費級 GPU	推理時僅啟動 3.8B 參數，延遲極低
31B Dense	稠密模型	單張 H100 80GB	原始品質最高，適合 fine-tune

性能排名

31B Dense：Arena AI 開源模型排行榜 第 3 名（LMArena 分數 1452）
26B MoE：排行榜 第 6 名（LMArena 分數 1441，僅用 4B 活躍參數）
能擊敗 20 倍大小的其他模型

核心能力

推理與 Agent

多步驟規劃與深層邏輯
原生支援 Function Calling、結構化 JSON 輸出、System Instructions
可建構與工具/API 互動的自主 Agent

多模態

所有版本：原生處理圖像和影片（可變解析度），支援 OCR、圖表理解
E2B/E4B：額外支援音頻輸入（語音辨識）

長上下文

邊緣模型：128K context window
大型模型：256K context window（可一次傳入整個 repo）

語言支援

原生訓練超過 140 種語言

程式碼

高品質離線程式碼生成，可作為本地 AI 程式碼助手

硬體支援

手機：Android（透過 AICore Developer Preview，與 Pixel 團隊合作）
行動晶片：Qualcomm Technologies、MediaTek
邊緣裝置：樹莓派、NVIDIA Jetson Orin Nano
消費級 GPU：量化版本，本機運行
工作站/伺服器：單張 NVIDIA H100 80GB（bfloat16 全精度）

授權

Apache 2.0（完全開源，商業可用），可自由部署於本地或雲端環境。

延伸資源

官方模型卡：ai.google.dev/gemma/docs/core/model_card_4
HuggingFace：gg-hf-gg/gemma-4-31B-it、gemma-4-26B-A4B-it、gemma-4-E4B-it、gemma-4-E2B-it