Mike 的訊號:法律 AI 正出現 self-hosted open-source 路線

這篇 Threads 介紹 Mike:一個開源法律 AI 平台,定位成 Harvey 與 Legora 的 open-source alternative。表面上看是「有人 clone 了法律 AI 大廠功能」,但真正值得記錄的是:法律 AI 這個高單價、強合規、強資料敏感的市場,正在出現一條 open-source / self-hosted 路線,試圖對抗 per-seat enterprise SaaS 與 vendor lock-in。

Mike 的官方網站標語很直接:The Open Source alternative to Harvey and Legora. All the features without an enterprise contract. 它主打功能包含:

  • Assistant:可讀文件、逐字引用、執行 multi-step workflows、起草與修改合約。
  • Projects:以 matter 為範圍的工作區,讓同一案件或交易中的文件與對話維持上下文。
  • Tabular review:像 spreadsheet 一樣跨大量文件抽取資訊,每個 cell 都要能回到頁碼與引用文字。
  • Workflows:把 CP checklist、credit agreement summary、change-of-control review 等 prompt 流程保存成可重複使用模板。

GitHub repo 是 theogbrand/mike-oss-legora-harvey,描述為 OSS AI Legal Platform。README 顯示它包含 frontend 與 backend:frontend 是 Next.js,backend 是 Express API、Supabase access、document processing 與 migrations;需要 Supabase Auth/Postgres、S3-compatible object storage,例如 Cloudflare R2、至少一個 model provider key,以及 LibreOffice 做 DOC/DOCX to PDF conversion。授權是 AGPL-3.0-only。

這裡要保守看:GitHub API 顯示這個 repo 非常新,幾乎沒有 stars / forks,created_at 是 2026-05-01。換句話說,它目前更像一個剛公開的產品/範例,而不是成熟到可直接替代 Harvey、Legora 的 enterprise legal AI 平台。

Mike 的價值主張有三個:

  1. 成本 法律 AI 大廠走 enterprise contract、per-seat pricing,成本高且會隨年度上升。Mike 說法是零 license cost,只付模型 API 成本。

  2. 資料控制 法律文件涉及 attorney-client privilege、商業機密、併購交易與訴訟資料。Mike 主打 self-hostable by design,文件可部署在自己的 infrastructure 裡,降低資料 residency / compliance 風險。

  3. 可審計與可客製 法律 AI 的黑盒風險很高。Mike 強調可 audit every line,可看 prompt 如何組、citation 如何 parse、data flow 怎麼走,也能加入特定 practice workflow、接 DMS、換 citation engine。

但 Hacker News 討論裡有一個法律專業者的提醒非常重要:這類工具不能簡單等同 Harvey / Westlaw / 正規 legal research assistant。真正的法律研究不只是「讓 LLM 讀幾份文件」,而是要接入完整 case law database、法規、判例引用關係、good law / bad law 狀態、專業內容與註釋。Thomson Reuters / Westlaw 這類公司貴,不只是因為 UI 或模型,而是因為它們握有法律資料庫與長期授權護城河。

所以 Mike 這類 open-source legal AI 比較適合的第一落點,不一定是完整 legal research,而是:

  • 合約審閱
  • due diligence 文件整理
  • matter 內部文件問答
  • 條款抽取與比對
  • 初稿產生與改寫
  • 事務所內部 workflow 自動化
  • 既有文件庫的 RAG / citation workflow

它若要真正挑戰 Harvey / Legora,需要補上幾個硬問題:

  • 法律資料來源:是否能合法取得完整法規、判例、專業內容?
  • 引用可靠性:每個答案是否能回到原文、頁碼、段落?
  • 權限模型:不同案件、客戶、律師、助理的資料隔離是否嚴格?
  • privilege 風險:即使 self-host,若 prompt 仍送到 Anthropic / Google,資料是否仍流向第三方?
  • 稽核:誰問了什麼、模型回了什麼、引用了哪些文件,是否可追蹤?
  • deployment:律所 IT 能否真的維護 Supabase、object storage、LibreOffice、model keys 與備份?

對台灣市場的啟發:法律 AI 不一定只有「做一個 SaaS 賣律師」這條路。更可能出現兩種產品型態:

  1. Enterprise SaaS 型 像 Harvey / Legora,主打大所、企業法務、完整合規流程與 account team。

  2. Self-hosted toolkit 型 像 Mike,讓較有技術能力的律所或法律科技團隊自行部署、接自家文件庫、保有資料控制權。

台灣律師事務所若要導入這類工具,我會建議先從低風險內部文件場景開始,例如契約摘要、條款比對、due diligence checklist、會議紀錄與案件文件索引;不要一開始就讓 AI 直接做法律結論或訴訟策略。法律 AI 的第一原則應該是:AI 協助整理與引用,人類負責判斷與簽核。

我的判斷:Mike 目前不應被看成 Harvey / Legora 的成熟替代品,而應被看成一個市場訊號:法律 AI 的需求已經清楚到有人願意把「Harvey-like workflow」做成 open-source stack。對 BigIntTech 來說,值得看的不是 Mike 本身多成熟,而是這個模式能不能移植到其他高信任垂直產業:會計、保險、物業管理、醫療行政、政府標案。凡是文件多、流程重、資料敏感、SaaS 授權貴的領域,都可能長出 self-hosted vertical AI。

來源:

Mike 的訊號:法律 AI 正出現 self-hosted open-source 路線 | Allen 知識庫 | Allen 知識庫