一張圖認識什麼是 Agent 和 Skill
用一張圖和幾個生活化的比喻,說清楚 AI Agent 和 Skill 的核心概念。

什麼是 Agent?
- LLM = 大腦
- Agent System = 身體
- LLM Credit = 氧氣
- 沒付錢LLM就停擺 = 沒氧氣大腦就死亡
- Tool Call = 手腳、五官
- 眼睛看(蒐集資訊 ex: web search)
- 手寫字(輸出內容 ex: edit files)
什麼是 Skill?
一個抽象化的 SOP
例如
- 做一杯飲料
- 拿杯子(沒杯子了要補貨)
- 裝茶(看什麼飲料裝對應的茶)
- 加糖(要多少糖)
- 加冰塊(要多少冰塊)
- 封膜
- 給客人
- 射門
- 眼睛(Tool call)找到門框和守門員位置
- 傳遞資訊給大腦,並思考怎麼射門比較好(call LLM)
- 身體(Agent System)的神經控制腳(Tool call)來射門
什麼是 Script, CLI, MCP Tool?
步驟足夠明確的SOP不適合寫成 skill(markdown),比較適合直接封裝成 script,甚至更複雜的流程會封裝成 CLI, MCP Tool
| 層次 | 定義 | 人類時代 | 現在封裝成 |
|---|---|---|---|
| Script | 完全自動,不需要任何輸入 | 工廠計件員用算盤計數 | 計數感應器,自動累計 |
| CLI | 需要給指令,固定處理後回傳結果 | 收銀員手動結帳 | POS 機(輸入品項 → 自動算帳印單) |
| MCP Tool | 連接外部服務,標準化的外部溝通 | 打電話叫快遞 | 串接快遞 API |
當有了流程(skill)和工具(script, cli, mcp tool),處理一個sop會更加有效率
例如
- 幫客人點餐 (skill)
- 詢問要點什麼,並確認餐點
- 操作 POS 機 - 點餐並計算金額 (cli)
- 收錢找零
- 操作 POS 機 - 結帳、印訂單和發票 (cli)
- 發票給客人
什麼是 MCP 和 MCP Tool?
遙控器(MCP)和冷氣(MCP Tool)
- 遙控器 = MCP
- Agent 用來跟外部服務溝通的統一規格
- 遙控器本身不會降溫,只負責發送指令
- 冷氣 = MCP Tool
- 實際執行任務的外部服務
- 收到指令後,才真正去做事
好處:同一個遙控器規格,可以控制冷氣、電視、音響 同一套 MCP 規格,Agent 可以串接快遞 API、天氣 API、Slack… 不需要為每個服務學一套新的溝通方式
總結
其實人類也是這樣運作的—— 重複的事情久了變成直覺、習慣(script) 剩下需要思考和判斷的才動用大腦(skill)
Agent 只是把這件事,搬到了軟體世界
分享:


