Whispurr:基於 macOS 26 Apple Speech API 的本機離線語音聽寫工具
2026年6月26日👀 4 次觀看
macOS · Local Dictation · Apple Speech API
Whispurr:用 macOS 26 內建 Speech API 做本機離線語音聽寫
Threads 作者 modularzhi 分享,macOS 26 新的 Speech API 效果比預期好,習慣「用嘴巴寫程式」的人可以先到 System Settings → Keyboard → Dictation 開啟試用;若不想讓語音上雲,也可嘗試作者釋出的 Whispurr。
一句話重點:Whispurr 是 macOS 選單列上的 push-to-talk 聽寫工具:按住
fn 說話、放開後把本機辨識與整理後的文字插入目前游標位置,主打 Mandarin + English code-switching 與不把音訊/文字送上雲端。
工具定位
Whispurr 不是傳統 TTS,而是 STT / Dictation:它解決的是「把語音變成可直接貼進程式編輯器、Slack、文件、Terminal 的乾淨文字」。對於習慣口述想法、寫 prompt、寫 commit message、寫程式備註的人,這類工具的價值在於降低打字摩擦。
本機優先
README 宣稱使用 on-device speech recognition 與 on-device LLM cleanup,沒有帳號、雲端或 telemetry;辨識文字也不寫入 system log。
中英混講
主打 Mandarin + English code-switching,例如「幫我 push 這個 commit」能保留繁中與英文技術詞。
按住說話
預設按住 fn 開始聽寫,放開後插入文字;Esc 可取消當次輸入。
macOS 26 專用
GitHub badge 標示 Requires macOS 26 Tahoe;第一次執行會下載 zh-TW speech model。
實際使用流程
- 下載最新
.dmg,拖入 Applications。 - 啟動 Whispurr,依序開啟 Input Monitoring、Microphone、Speech Recognition、Accessibility 權限。
- 在 macOS 設定中把「Press Globe key to」設為 Do Nothing,避免系統攔截
fn。 - 按住
fn說話,放開後文字會整理並插入目前 app 的游標位置。
為什麼值得注意
| 面向 | 觀察 |
|---|---|
| 隱私 | 對不想把會議、程式碼、內部討論音訊送到雲端的人,本機辨識是關鍵賣點。 |
| 開發者輸入 | 中文口述常會夾英文技術詞;若能保留 code-switching,對寫程式與寫 prompt 很實用。 |
| Apple 生態 | macOS 26 Speech API + Apple Intelligence 代表 Apple 內建語音能力開始可被第三方工具包裝成 workflow。 |
| 產品細節 | Menu-bar app、push-to-talk、HUD、可愛像素西裝貓,降低語音輸入工具的心理距離。 |
授權注意:Threads 文字稱「開源」,但檢查 GitHub repo 時,GitHub API 顯示
license: null,且 README 底部寫著 “Not yet open-source-licensed — please ask before reuse.” 因此目前不應直接視為 MIT / Apache / 可商用開源專案。若要 fork、整合進商業產品或重用程式碼,需要先向作者確認授權。
適合誰
- 想在 Mac 上本機離線做中文/英文混合聽寫的人。
- 常用語音寫 prompt、commit message、文件草稿、Slack 回覆的人。
- 在意語音與文字隱私,不想使用雲端 STT 的開發者。
- 想觀察 macOS 26 Speech API 實際可用性的產品/工具開發者。
仍需確認的風險
- 授權:目前沒有 LICENSE,不符合嚴格開源重用條件。
- 系統需求:需要 macOS 26 Tahoe;舊版 macOS 無法直接假設可用。
- Apple Intelligence 依賴:README 提到若 Apple Intelligence 關閉,會插入 raw transcript,整理品質會下降。
- 早期專案:repo 建立於 2026-06-25,星數與 issue 訊號仍很少,穩定性需實測。