AnySearch:不是 URL 轉 Markdown,而是給 Agent 用的 search / routing / normalization 層
Agent Web Data Stack / Search Infrastructure
AnySearch:不是 URL 轉 Markdown,而是給 Agent 用的 search / routing / normalization 層
這則 Threads 討論 AnySearch 與 Firecrawl / 自寫 agent flow 的差異。關鍵不是「能不能把單一網頁轉成 Markdown」,而是當 agent 還不知道該看哪些來源時,有沒有一層能先做搜尋、來源路由、內容型態選擇與結構化回傳。
核對資訊:AnySearch 官網標題為
AI Search Infrastructure for Agents;meta description 稱其為 privacy-first search infrastructure for AI Agents,包含 anonymous access、smart routing、structured output、native API、MCP、Skill integration。Docs 顯示 API base URL 為 https://api.anysearch.com,主要端點是 POST /v1/search。跟 Firecrawl 的差異
Firecrawl 類工具擅長抓取與抽取指定 URL。AnySearch 的定位更前一層:輸入 query,gateway 依 intent routing 到合適 providers,融合與 re-rank results,再回傳較適合 AI 消化的內容。
Threads 的實測觀察
作者認為它在開發文件、結構化查詢、agent 需要一次拿到官方文件、社群、影片、官網等多來源時比較有感;追即時新聞則普通 web search 可能已足夠。
高訊號反對意見
留言指出:如果只是指定 URL 的 scrape,可以透過 agent.md / prompt 規則讓 agent 自行處理圖片下載、表格、mermaid、marp 等輸出,不一定需要額外服務。
比較務實的定位
AnySearch 的價值不是「你自己做不到」,而是省掉 search、source routing、content normalization、MCP / Skill 包裝與維護成本。這是 buy vs build 的問題。
| 需求 | 較適合的做法 | 理由 |
|---|---|---|
| 已知 URL,轉 Markdown / 擷取內文 | Firecrawl、browser、custom scraper | 不需要 search routing,直接 extract 更單純。 |
| 不知道該看哪個來源,只知道問題 | AnySearch / Tavily 類 search API | 需要 query → provider routing → result fusion → re-rank。 |
| 需要 agent-native integration | AnySearch MCP / Skill | 可讓 Claude Code / Codex / agent workflow 直接調用。 |
| 高度客製資料處理 | 自寫 agent flow + 規則 | 可控制圖片、表格、PPT、mermaid、引用格式與資料治理。 |
評估這類 agent search infra 的問題:
- 是否支援匿名免費額度?超額後如何收費?
- 是否有 API key 模式、concurrency limit、quota headers、request_id?
- routing provider 是否透明?可否指定 domain、freshness、content_types?
- 回傳是否有 source URL、snippet、metadata、structured output?
- MCP / Skill 是否只是薄 wrapper,還是有可用的 search workflow?
- 是否會把敏感 query 丟給第三方 providers?資料治理怎麼處理?
來源:
Threads: https://www.threads.com/@dsif2017/post/DYoaiyxFbu1
AnySearch: https://www.anysearch.com/
Docs: https://www.anysearch.com/docs
Threads: https://www.threads.com/@dsif2017/post/DYoaiyxFbu1
AnySearch: https://www.anysearch.com/
Docs: https://www.anysearch.com/docs