AgentOpt 真正補上的，不是 server-side serving，而是 agent 時代被低估的 client-side optimization：模型怎麼配、工具怎麼選、預算怎麼分

這篇 arXiv 論文的題目是 AgentOpt v0.1 Technical Report: Client-Side Optimization for LLM-Based Agent。它最值得記錄的地方，不只是又提出一個 agent framework，而是它抓到一個很容易被忽略、但其實非常實務的問題：

大家都在優化 server-side serving，但真正用 agent 的人，還有一整個 client-side 的配置問題沒被好好處理。

論文點名的背景很直接：像 Manus、OpenClaw、各種 coding agents 這類系統，實際上常常不是單一模型一直跑到底，而是由多個 pipeline stage 組成，混合了：

不同模型
本地工具
遠端 API
各種成本、延遲與品質限制

這時真正重要的問題變成：每一段到底要配哪個模型、怎麼分 API 預算、哪些地方用本地工具，才是整體最划算？

這篇真正值得記錄的重點

1. 它把優化問題從 server 端，拉回到 agent 使用者真正會碰到的 client 端

過去很多研究都在做：

caching
speculative execution
traffic scheduling
load balancing

這些都很重要，但它們多半是在解 服務提供方 的問題。

AgentOpt 在意的是另一題：

如果你是 agent 開發者，你手上有不同模型、不同工具、不同 API 成本限制，你應該怎麼組這條 pipeline？

這其實更接近真實開發與部署時的痛點。

2. 模型分工配置的成本差，可能大到 13–32 倍

論文最有殺傷力的一組結果是：

在準確率相近的情況下
最佳與最差模型組合之間的成本差距可達 13–32 倍

這個訊號很強，因為它代表很多 agent 的成本問題，不一定是模型本身太貴，而可能是：

模型分工配錯了
每個 pipeline role 沒有用到最划算的模型
預算被浪費在不值得用高階模型的步驟

3. 它真正想做的是「agent pipeline 的組合搜尋器」

因為不同 stage 的模型配置組合會指數爆炸，AgentOpt 的核心方法其實很像在做一個搜尋與實驗框架。

論文提到它實作了 8 種 search algorithms，包括：

Arm Elimination
Epsilon-LUCB
Threshold Successive Elimination
Bayesian Optimization

目標不是窮舉，而是在小型 evaluation set 上，用更少預算找到接近最優的模型配置。

4. 這篇真正有價值的地方，是它把 agent engineering 往更成熟的「系統優化」推進

很多人談 agent，還停在：

prompt 怎麼寫
工具怎麼接
workflow 怎麼拆

但這篇論文更往前一步，問的是：

當 workflow 拆完之後，你有沒有系統化方法去決定每一段最划算的資源配置？

這代表 agent engineering 正在從 heuristic / 手感配置，往更可測量、可搜索、可優化的工程問題移動。

5. 它對 OpenClaw 這類多步 agent 特別有啟發

這篇之所以值得 Allen 記，不只是因為論文裡直接點到 OpenClaw，而是它的問題設定本身就很貼近我們這類系統：

不同任務可用不同模型
某些步驟用強模型才值得
某些步驟其實便宜模型就夠
本地工具 / 遠端 API / latency / budget 需要一起算

也就是說，它在補的是：

agent orchestration 的下一層，不只是排流程，而是做資源分配優化。

我的判讀

這篇論文真正值得記錄的，不是它又提出一個新 package，而是它在提醒一件很現實的事：

LLM agent 的成本與效率問題，很多時候不是出在 server 端，而是出在 client 端的配置方式。

未來誰能把 agent 的：

模型選擇
pipeline role 分工
工具使用
API 預算
latency / quality tradeoff

做成可以被系統化優化的東西，誰就可能在真實部署中佔到很大的優勢。

Allen 的一句話版

AgentOpt 真正值得記的，不是它又做了一個 agent package，而是它把一個很關鍵但常被忽略的問題講清楚：agent 時代不只要優化 server-side serving，還要優化 client-side 的模型配置、工具選擇與 API 預算分配。