文章 分類 標籤 關於
一張圖認識什麼是 Agent 和 Skill
🤖 人工智慧 · 3 分鐘閱讀

一張圖認識什麼是 Agent 和 Skill

用一張圖和幾個生活化的比喻,說清楚 AI Agent 和 Skill 的核心概念。

一張圖認識Agent和Skill流程圖

什麼是 Agent?

  • LLM = 大腦
  • Agent System = 身體
  • LLM Credit = 氧氣
    • 沒付錢LLM就停擺 = 沒氧氣大腦就死亡
  • Tool Call = 手腳、五官
    • 眼睛看(蒐集資訊 ex: web search)
    • 手寫字(輸出內容 ex: edit files)

什麼是 Skill?

一個抽象化的 SOP

例如

  • 做一杯飲料
    • 拿杯子(沒杯子了要補貨)
    • 裝茶(看什麼飲料裝對應的茶)
    • 加糖(要多少糖)
    • 加冰塊(要多少冰塊)
    • 封膜
    • 給客人
  • 射門
    • 眼睛(Tool call)找到門框和守門員位置
    • 傳遞資訊給大腦,並思考怎麼射門比較好(call LLM)
    • 身體(Agent System)的神經控制腳(Tool call)來射門

什麼是 Script, CLI, MCP Tool?

步驟足夠明確的SOP不適合寫成 skill(markdown),比較適合直接封裝成 script,甚至更複雜的流程會封裝成 CLI, MCP Tool

層次定義人類時代現在封裝成
Script完全自動,不需要任何輸入工廠計件員用算盤計數計數感應器,自動累計
CLI需要給指令,固定處理後回傳結果收銀員手動結帳POS 機(輸入品項 → 自動算帳印單)
MCP Tool連接外部服務,標準化的外部溝通打電話叫快遞串接快遞 API

當有了流程(skill)和工具(script, cli, mcp tool),處理一個sop會更加有效率
例如

  • 幫客人點餐 (skill)
    • 詢問要點什麼,並確認餐點
    • 操作 POS 機 - 點餐並計算金額 (cli)
    • 收錢找零
    • 操作 POS 機 - 結帳、印訂單和發票 (cli)
    • 發票給客人

什麼是 MCP 和 MCP Tool?

遙控器(MCP)和冷氣(MCP Tool)

  • 遙控器 = MCP
    • Agent 用來跟外部服務溝通的統一規格
    • 遙控器本身不會降溫,只負責發送指令
  • 冷氣 = MCP Tool
    • 實際執行任務的外部服務
    • 收到指令後,才真正去做事

好處:同一個遙控器規格,可以控制冷氣、電視、音響 同一套 MCP 規格,Agent 可以串接快遞 API、天氣 API、Slack… 不需要為每個服務學一套新的溝通方式

總結

其實人類也是這樣運作的—— 重複的事情久了變成直覺、習慣(script) 剩下需要思考和判斷的才動用大腦(skill)

Agent 只是把這件事,搬到了軟體世界



Logan

資深軟體工程師,熱衷寫程式與智慧家庭 🏠

本文採用 CC BY-NC 4.0 授權


分享:


相關文章


輸入關鍵字搜尋文章