把 Gemini 免費額度包成 OpenAI / Whisper 相容接口:這類玩法真正有價值的,不只是省月費,而是把既有 app 的後端能力重新接管
這則 Threads 分享一個很實戰的做法:市面上有些語音轉錄 app 需要月費,但如果只是日常短語音使用,Google AI Studio 的 Gemini 免費額度其實可能已經夠用。作者的解法,是在本地用 Node.js 做一層 proxy,把語音請求轉成 Gemini 原生 API 格式,再用 Cloudflare Tunnel 暴露成固定 HTTPS 網址,讓原本只認 OpenAI / Whisper 介面的產品也能接上去。
這篇真正有價值的,不只是省錢,而是它展現了一種很實用的產品控制方式。
1. 真正的重點不是換模型,而是接管介面相容層
很多產品之所以綁死某個供應商,不是因為功能不能替換,而是因為介面與格式已經寫死。這篇的漂亮之處在於,它沒有去改 app 本身,而是做一個相容層:上游看起來像 Whisper / OpenAI API,下游實際上走 Gemini。
2. 這類 proxy 思維,會是 AI 成本治理的重要能力
如果團隊能夠用 proxy 或 compatibility layer 把高價供應商、特定格式 API、舊客戶端需求,跟新的低成本模型供應商接起來,那整個成本結構就會突然多出很大的操作空間。
3. 相容層思維比單純比模型更重要
產品實務上更重要的常常是:能不能無痛接入現有工作流、能不能不動既有前端、能不能快速切換供應商。這篇最值得學的地方,是它沒有把問題想成「我要重做一套」,而是想成「我要在現有介面前面插一層控制點」。
我的判斷
用 Gemini 免費額度替代付費語音轉錄工具,真正有價值的不是省下一點訂閱費,而是它示範了如何用 proxy / compatibility layer 重新掌握原本被供應商鎖住的 AI 功能接口。