阿里 Qwen 團隊核心成員集體離職事件

基本資訊

作者: tom_my_butler
來源: Threads
發布時間: 2026-03-06 17:41（8 小時前）
觀看數: 4.8K
社群反應: 42 讚、5 則留言、3 分享、12 收藏
原文連結: Threads

重大事件

離職公告（2026-03-03）

林俊旸（技術負責人）

「bye my beloved qwen」

背景:

年齡：32 歲
職級：阿里最年輕的 P10
職位：Qwen 技術負責人

確認: 同事陳程在底下確認：離開不是他自己的選擇

連鎖離職

幾小時內:

郁博文（後訓練負責人）:

「bye qwen, me too」

Kaixin Li（Qwen 3.5 核心貢獻者）:

「他走了，我沒理由留」

結果: 一天之內，Qwen 模型團隊的技術核心走了至少四個人

Qwen 在全球開源 AI 生態的地位

規模數據

開源影響力:

400+ 開源模型
Hugging Face 下載量破 10 億次
衍生模型超過 17 萬個

商業成功:

App 月活（1 月）：3,100 萬
App 月活（2 月）：2.03 億
成長率：550%+

業界認可: 馬斯克兩天前公開誇 Qwen 3.5 有「令人印象深刻的智能密度」

結論

不管從哪個維度看，這都是一支正在高速上升的團隊。然後管理層決定換掉帶隊的人。

背後過程（多方報導拼湊）

空降主管

新主管背景:

來自 Google DeepMind / Gemini
由阿里雲空降

組織重組計畫

原本: 垂直整合團隊

計畫改為: 水平分工：

預訓練團隊
後訓練團隊
其他分工團隊

架空林俊旸

手法:

林俊旸的管理範圍被壓縮
新主管直接向上報告，跳過了他
不是開除，但把他架空了

衝突核心：考核邏輯

新考核標準

阿里雲開始用 **DAU（日活躍用戶數）**來評估 Qwen 團隊

對比對象: 字節跳動的「豆包」

內部評價: 甚至有人稱 Qwen 3.5 是「半成品」

作者批判

用 DAU 考核一個基礎模型團隊，就像用票房評價一間半導體研發實驗室。

DAU 的侷限

DAU 衡量的是: 消費者端產品的黏著度

Qwen 的核心價值在: 開源生態的影響力，不在 App 本身

被忽略的價值

17 萬個衍生模型的應用:

中國新能源車上跑的大模型
機器人公司的 VLA 模型
很大一部分建立在 Qwen 開源的基礎上

問題: 這些價值完全不會反映在 DAU 指標裡

技術哲學衝突

林俊旸的堅持

「預訓練、基礎設施和訓練必須緊密耦合」

理由:

微小的參數調整就可能觸發巨大的效能波動
拆開來分工會破壞模型開發的完整性

管理層的訴求

目標:

更快的商業化節奏
更高的市佔率

結構性問題（虎嗅分析）

中國科技巨頭的管理基因

起家模式: 靠應用層創新起家

擅長:

精細的部門分工
KPI 驅動

基礎模型研究的需求

需要的模式: 小型、自主、容錯的「特種部隊」模式

管理錯配

把應用層的管理邏輯套在基礎研究上，等於用管理消費者 App 的方式管理科學研究。

市場反應

阿里股價

消息傳出後:

阿里港股盤中跌 5.3%
10 月以來最大單日跌幅

官方回應

阿里官方: 沒有正式回應

社群留言

purplemaple_tb（4 小時前）

「我是老闆，我也會改用 deepmind 來的人」

francine.rjto30（4 小時前）

「好可惜啊…Qwen 算是遣詞造句和感情濃度比較接近 4o 的了，這就走了也太可惜了」

matchaazukii1217（5 小時前）

個人使用體驗

Qwen 2.5 Max:

真的很驚艷
做運輸路徑規劃問題時，只有 Qwen 給出正確答案
不僅開源，還吊打一堆付費模型

Qwen 3:

個人體感不如 Qwen 2.5 Max
官網現在還保留了 2.5 Max 的選項

猜測:

「我猜那時候可能就已經出問題了，模型一直沒有太大的進步」

商業化困境

付費模式: Qwen 一直沒有付費模式

阿里的壓力:

「我猜阿里也不能容忍一個項目一直燒錢下去」

廣告觀察:

「新年時候回國看到千問鋪天蓋地的一大堆廣告，用千問來搶外賣優惠券什麼的」

開發者心情:

「如果這是我的心血結晶，我也受不了」

關鍵洞察

1️⃣ 用錯誤的指標考核基礎研究

問題: 用 DAU 考核基礎模型團隊

類比:

就像用票房評價一間半導體研發實驗室

原因:

DAU 衡量消費者產品黏著度
基礎模型的價值在開源生態影響力
17 萬個衍生模型的價值不會反映在 DAU

💡 教訓: 不同類型的團隊需要不同的考核標準

2️⃣ 開源生態的價值難以量化

Qwen 的真實價值:

17 萬個衍生模型
中國新能源車的大模型
機器人公司的 VLA 模型

問題: 這些價值無法用 DAU、營收等傳統指標衡量

💡 教訓: 開源項目需要新的價值評估框架

3️⃣ 應用層管理 vs 基礎研究管理

中國科技巨頭的基因:

應用層創新起家
精細部門分工
KPI 驅動

基礎模型研究需要:

小型、自主、容錯
「特種部隊」模式

衝突:

用管理消費者 App 的方式管理科學研究

💡 教訓: 管理模式需要隨組織類型調整

4️⃣ 技術整合 vs 分工效率

林俊旸的堅持:

預訓練、基礎設施、訓練必須緊密耦合
微小參數調整可能觸發巨大效能波動
拆開分工會破壞完整性

管理層的邏輯:

水平分工提高效率
更快商業化節奏

問題: 基礎研究的「整體性」vs 商業化的「效率優先」

💡 教訓: 基礎研究可能需要容忍低效率以保持整體性

5️⃣ 「架空」比「開除」更傷人

手法:

不開除林俊旸
但壓縮管理範圍
新主管跳過他直接向上報告

效果:

林俊旸選擇離開
核心團隊連鎖離職

💡 教訓: 架空比開除更容易引發連鎖反應

6️⃣ 開源項目的商業化困境

問題:

Qwen 沒有付費模式
阿里不能容忍一直燒錢
用廣告（搶外賣優惠券）變現

開發者心情:

「如果這是我的心血結晶，我也受不了」

💡 教訓: 開源項目需要找到可持續的商業模式

7️⃣ Qwen 2.5 Max > Qwen 3 的反常現象

用戶體驗:

Qwen 2.5 Max 很驚艷
Qwen 3 體感不如 2.5 Max
官網現在還保留 2.5 Max 選項

可能原因:

管理層壓力導致模型發布節奏過快
追求商業化速度犧牲品質

💡 教訓: 快速迭代不一定帶來進步

8️⃣ 馬斯克讚賞後的諷刺

時間點:

馬斯克兩天前才誇 Qwen 3.5
然後核心團隊離職

諷刺: 正在高速上升的團隊，管理層決定換掉帶隊的人

💡 教訓: 商業成功不代表內部管理健康

與其他文章關聯

中國 AI 大模型競爭系列

相關文章:

#87: Apple M4 ANE 逆向工程（@ainnoforge，有爭議）
#94: Qwen3.5 兩張 3090 跑 100t/s（@ainnoforge，有爭議）
#132: 阿里 Qwen 團隊集體離職（本文）

共同主題: 中國 AI 大模型的技術實力與內部管理挑戰

開源 AI 生態系列