阿里 Qwen 團隊核心成員集體離職事件
阿里 Qwen 團隊核心成員集體離職事件
基本資訊
- 作者: tom_my_butler
- 來源: Threads
- 發布時間: 2026-03-06 17:41(8 小時前)
- 觀看數: 4.8K
- 社群反應: 42 讚、5 則留言、3 分享、12 收藏
- 原文連結: Threads
重大事件
離職公告(2026-03-03)
林俊旸(技術負責人)
「bye my beloved qwen」
背景:
- 年齡:32 歲
- 職級:阿里最年輕的 P10
- 職位:Qwen 技術負責人
確認: 同事陳程在底下確認:離開不是他自己的選擇
連鎖離職
幾小時內:
郁博文(後訓練負責人):
「bye qwen, me too」
Kaixin Li(Qwen 3.5 核心貢獻者):
「他走了,我沒理由留」
結果: 一天之內,Qwen 模型團隊的技術核心走了至少四個人
Qwen 在全球開源 AI 生態的地位
規模數據
開源影響力:
- 400+ 開源模型
- Hugging Face 下載量破 10 億次
- 衍生模型超過 17 萬個
商業成功:
- App 月活(1 月):3,100 萬
- App 月活(2 月):2.03 億
- 成長率:550%+
業界認可: 馬斯克兩天前公開誇 Qwen 3.5 有「令人印象深刻的智能密度」
結論
不管從哪個維度看,這都是一支正在高速上升的團隊。然後管理層決定換掉帶隊的人。
背後過程(多方報導拼湊)
空降主管
新主管背景:
- 來自 Google DeepMind / Gemini
- 由阿里雲空降
組織重組計畫
原本: 垂直整合團隊
計畫改為: 水平分工:
- 預訓練團隊
- 後訓練團隊
- 其他分工團隊
架空林俊旸
手法:
- 林俊旸的管理範圍被壓縮
- 新主管直接向上報告,跳過了他
- 不是開除,但把他架空了
衝突核心:考核邏輯
新考核標準
阿里雲開始用 **DAU(日活躍用戶數)**來評估 Qwen 團隊
對比對象: 字節跳動的「豆包」
內部評價: 甚至有人稱 Qwen 3.5 是「半成品」
作者批判
用 DAU 考核一個基礎模型團隊,就像用票房評價一間半導體研發實驗室。
DAU 的侷限
DAU 衡量的是: 消費者端產品的黏著度
Qwen 的核心價值在: 開源生態的影響力,不在 App 本身
被忽略的價值
17 萬個衍生模型的應用:
- 中國新能源車上跑的大模型
- 機器人公司的 VLA 模型
- 很大一部分建立在 Qwen 開源的基礎上
問題: 這些價值完全不會反映在 DAU 指標裡
技術哲學衝突
林俊旸的堅持
「預訓練、基礎設施和訓練必須緊密耦合」
理由:
- 微小的參數調整就可能觸發巨大的效能波動
- 拆開來分工會破壞模型開發的完整性
管理層的訴求
目標:
- 更快的商業化節奏
- 更高的市佔率
結構性問題(虎嗅分析)
中國科技巨頭的管理基因
起家模式: 靠應用層創新起家
擅長:
- 精細的部門分工
- KPI 驅動
基礎模型研究的需求
需要的模式: 小型、自主、容錯的「特種部隊」模式
管理錯配
把應用層的管理邏輯套在基礎研究上,等於用管理消費者 App 的方式管理科學研究。
市場反應
阿里股價
消息傳出後:
- 阿里港股盤中跌 5.3%
- 10 月以來最大單日跌幅
官方回應
阿里官方: 沒有正式回應
社群留言
purplemaple_tb(4 小時前)
「我是老闆,我也會改用 deepmind 來的人」
francine.rjto30(4 小時前)
「好可惜啊…Qwen 算是遣詞造句和感情濃度比較接近 4o 的了,這就走了也太可惜了」
matchaazukii1217(5 小時前)
個人使用體驗
Qwen 2.5 Max:
- 真的很驚艷
- 做運輸路徑規劃問題時,只有 Qwen 給出正確答案
- 不僅開源,還吊打一堆付費模型
Qwen 3:
- 個人體感不如 Qwen 2.5 Max
- 官網現在還保留了 2.5 Max 的選項
猜測:
「我猜那時候可能就已經出問題了,模型一直沒有太大的進步」
商業化困境
付費模式: Qwen 一直沒有付費模式
阿里的壓力:
「我猜阿里也不能容忍一個項目一直燒錢下去」
廣告觀察:
「新年時候回國看到千問鋪天蓋地的一大堆廣告,用千問來搶外賣優惠券什麼的」
開發者心情:
「如果這是我的心血結晶,我也受不了」
關鍵洞察
1️⃣ 用錯誤的指標考核基礎研究
問題: 用 DAU 考核基礎模型團隊
類比:
就像用票房評價一間半導體研發實驗室
原因:
- DAU 衡量消費者產品黏著度
- 基礎模型的價值在開源生態影響力
- 17 萬個衍生模型的價值不會反映在 DAU
💡 教訓: 不同類型的團隊需要不同的考核標準
2️⃣ 開源生態的價值難以量化
Qwen 的真實價值:
- 17 萬個衍生模型
- 中國新能源車的大模型
- 機器人公司的 VLA 模型
問題: 這些價值無法用 DAU、營收等傳統指標衡量
💡 教訓: 開源項目需要新的價值評估框架
3️⃣ 應用層管理 vs 基礎研究管理
中國科技巨頭的基因:
- 應用層創新起家
- 精細部門分工
- KPI 驅動
基礎模型研究需要:
- 小型、自主、容錯
- 「特種部隊」模式
衝突:
用管理消費者 App 的方式管理科學研究
💡 教訓: 管理模式需要隨組織類型調整
4️⃣ 技術整合 vs 分工效率
林俊旸的堅持:
- 預訓練、基礎設施、訓練必須緊密耦合
- 微小參數調整可能觸發巨大效能波動
- 拆開分工會破壞完整性
管理層的邏輯:
- 水平分工提高效率
- 更快商業化節奏
問題: 基礎研究的「整體性」vs 商業化的「效率優先」
💡 教訓: 基礎研究可能需要容忍低效率以保持整體性
5️⃣ 「架空」比「開除」更傷人
手法:
- 不開除林俊旸
- 但壓縮管理範圍
- 新主管跳過他直接向上報告
效果:
- 林俊旸選擇離開
- 核心團隊連鎖離職
💡 教訓: 架空比開除更容易引發連鎖反應
6️⃣ 開源項目的商業化困境
問題:
- Qwen 沒有付費模式
- 阿里不能容忍一直燒錢
- 用廣告(搶外賣優惠券)變現
開發者心情:
「如果這是我的心血結晶,我也受不了」
💡 教訓: 開源項目需要找到可持續的商業模式
7️⃣ Qwen 2.5 Max > Qwen 3 的反常現象
用戶體驗:
- Qwen 2.5 Max 很驚艷
- Qwen 3 體感不如 2.5 Max
- 官網現在還保留 2.5 Max 選項
可能原因:
- 管理層壓力導致模型發布節奏過快
- 追求商業化速度犧牲品質
💡 教訓: 快速迭代不一定帶來進步
8️⃣ 馬斯克讚賞後的諷刺
時間點:
- 馬斯克兩天前才誇 Qwen 3.5
- 然後核心團隊離職
諷刺: 正在高速上升的團隊,管理層決定換掉帶隊的人
💡 教訓: 商業成功不代表內部管理健康
與其他文章關聯
中國 AI 大模型競爭系列
相關文章:
- #87: Apple M4 ANE 逆向工程(@ainnoforge,有爭議)
- #94: Qwen3.5 兩張 3090 跑 100t/s(@ainnoforge,有爭議)
- #132: 阿里 Qwen 團隊集體離職(本文)
共同主題: 中國 AI 大模型的技術實力與內部管理挑戰
開源 AI 生態系列
相關文章:
- #43: Agent Skills 標準介紹
- #124: Google Workspace CLI(100+ Agent Skills)
- #132: 阿里 Qwen 團隊集體離職(開源生態價值,本文)
共同主題: 開源 AI 的價值與商業化困境
未來影響
對 Qwen 項目
短期:
- 核心團隊流失
- 技術發展可能受阻
長期:
- 看新團隊能否延續開源精神
- 是否會走向完全商業化
對阿里
技術:
- 失去基礎模型核心人才
- 競爭力削弱
聲譽:
- 開源社群信心受損
- 股價下跌 5.3%
對中國 AI 生態
警訊:
- 應用層管理模式不適合基礎研究
- 開源項目的商業化困境
- 人才流失風險
啟示: 需要建立適合基礎研究的管理模式
延伸思考
Google DeepMind 空降主管的兩面性
正面:
- 國際頂尖經驗
- 可能帶來新視野
負面:
- 可能不理解中國開源生態
- 與原團隊文化衝突
DAU 考核的普遍問題
適用場景: 消費者端產品(社交、電商、遊戲)
不適用場景:
- 基礎研究
- 開源項目
- B2B 產品
中國科技巨頭的轉型挑戰
問題: 應用層管理基因根深蒂固
挑戰: 如何建立適合基礎研究的管理模式
案例: 阿里 Qwen、字節豆包、百度文心
標籤
#Qwen #阿里巴巴 #AI #開源 #大模型 #人工智慧 #林俊旸 #團隊離職 #DAU #考核指標 #基礎研究 #商業化 #Google DeepMind #馬斯克 #開源生態 #虎嗅