Whispurr：基於 macOS 26 Apple Speech API 的本機離線語音聽寫工具

macOS · Local Dictation · Apple Speech API

Whispurr：用 macOS 26 內建 Speech API 做本機離線語音聽寫

Threads 作者 modularzhi 分享，macOS 26 新的 Speech API 效果比預期好，習慣「用嘴巴寫程式」的人可以先到 System Settings → Keyboard → Dictation 開啟試用；若不想讓語音上雲，也可嘗試作者釋出的 Whispurr。

一句話重點：Whispurr 是 macOS 選單列上的 push-to-talk 聽寫工具：按住 fn 說話、放開後把本機辨識與整理後的文字插入目前游標位置，主打 Mandarin + English code-switching 與不把音訊/文字送上雲端。

工具定位

Whispurr 不是傳統 TTS，而是 STT / Dictation：它解決的是「把語音變成可直接貼進程式編輯器、Slack、文件、Terminal 的乾淨文字」。對於習慣口述想法、寫 prompt、寫 commit message、寫程式備註的人，這類工具的價值在於降低打字摩擦。

本機優先

README 宣稱使用 on-device speech recognition 與 on-device LLM cleanup，沒有帳號、雲端或 telemetry；辨識文字也不寫入 system log。

中英混講

主打 Mandarin + English code-switching，例如「幫我 push 這個 commit」能保留繁中與英文技術詞。

按住說話

預設按住 fn 開始聽寫，放開後插入文字；Esc 可取消當次輸入。

macOS 26 專用

GitHub badge 標示 Requires macOS 26 Tahoe；第一次執行會下載 zh-TW speech model。

實際使用流程

下載最新 .dmg，拖入 Applications。
啟動 Whispurr，依序開啟 Input Monitoring、Microphone、Speech Recognition、Accessibility 權限。
在 macOS 設定中把「Press Globe key to」設為 Do Nothing，避免系統攔截 fn。
按住 fn 說話，放開後文字會整理並插入目前 app 的游標位置。

為什麼值得注意

面向	觀察
隱私	對不想把會議、程式碼、內部討論音訊送到雲端的人，本機辨識是關鍵賣點。
開發者輸入	中文口述常會夾英文技術詞；若能保留 code-switching，對寫程式與寫 prompt 很實用。
Apple 生態	macOS 26 Speech API + Apple Intelligence 代表 Apple 內建語音能力開始可被第三方工具包裝成 workflow。
產品細節	Menu-bar app、push-to-talk、HUD、可愛像素西裝貓，降低語音輸入工具的心理距離。

授權注意：Threads 文字稱「開源」，但檢查 GitHub repo 時，GitHub API 顯示 license: null，且 README 底部寫著 “Not yet open-source-licensed — please ask before reuse.” 因此目前不應直接視為 MIT / Apache / 可商用開源專案。若要 fork、整合進商業產品或重用程式碼，需要先向作者確認授權。

適合誰

想在 Mac 上本機離線做中文/英文混合聽寫的人。
常用語音寫 prompt、commit message、文件草稿、Slack 回覆的人。
在意語音與文字隱私，不想使用雲端 STT 的開發者。
想觀察 macOS 26 Speech API 實際可用性的產品/工具開發者。

仍需確認的風險

授權：目前沒有 LICENSE，不符合嚴格開源重用條件。
系統需求：需要 macOS 26 Tahoe；舊版 macOS 無法直接假設可用。
Apple Intelligence 依賴：README 提到若 Apple Intelligence 關閉，會插入 raw transcript，整理品質會下降。
早期專案：repo 建立於 2026-06-25，星數與 issue 訊號仍很少，穩定性需實測。