文章 分類 標籤 關於
Claude Code 工作流框架全比較:五個工具怎麼選?
🤖 人工智慧 · 16 分鐘閱讀

Claude Code 工作流框架全比較:五個工具怎麼選?

AI 寫 code 的品質瓶頸,不只是 prompt 好不好,還有流程。三個月後回來看 code,context 丟了,只剩 code,設計決策就消失了。社群裡最近出現一批工具,切入點不同——規格、流程、review、底層優化——但都在解決同一件事:讓 AI 產出的東西有持...

📅 研究時間:2026 年 3 月,AI 工具迭代極快,文章中提到的功能、指令或框架設計,三個月後可能就有重大變化。本文記錄的是當下的觀察與比較,讀者使用前建議確認最新官方文件。

AI 寫 code 的品質瓶頸,不只是 prompt 好不好,還有流程。三個月後回來看 code,context 丟了,只剩 code,設計決策就消失了。社群裡最近出現一批工具,切入點不同——規格、流程、review、底層優化——但都在解決同一件事:讓 AI 產出的東西有持久價值。以下是這五個工具的完整比較。

五個工具概覽

工具定位核心解決問題上手難度
Claude Code 原生內建功能,無需安裝並行執行、探索前置
OpenSpec規格管理框架設計決策持久化、可追溯⭐⭐
Superpowers完整開發生命週期全流程自動化 + TDD 強制⭐⭐⭐
gstack多角色 review 框架多視角品質把關(20 個角色)⭐⭐
everything-claude-code底層效能優化層context 持久化 + agent 體質⭐⭐⭐⭐

Claude Code 原生

Plan Mode + Bundled Skills,不需要安裝任何東西。

核心功能

  • Plan Mode:輸入 /plan [任務描述] 進入;AI 探索 codebase、問問題,不修改 source code,輸出計畫讓你確認後再實作
  • /simplify:自動派三個平行 review agents 找品質問題並修正
  • /batch <instruction>:大規模並行改動(需在 git repository 內),自動拆成 5-30 個 task,每個在獨立 git worktree 執行並可開 PR
  • /loop [interval] <prompt>:定時循環執行,用來 poll deploy 狀態(僅當前 session 有效,關掉即失效)
  • /debug:mid-session 啟用 debug logging,分析日誌找問題根因
  • /claude-api:自動載入當前語言的 Claude API 文件;偵測到 anthropic@anthropic-ai/sdkclaude_agent_sdk 匯入時也可自動觸發
  • CLAUDE.md:放專案根目錄,每次 session 自動讀取,存架構決策、開發規範、review checklist

工作流程

graph TD
  A[開啟 Plan Mode] --> B[AI 探索 codebase]
  B --> C[輸出計畫]
  C --> D[確認計畫]
  D --> E[開始實作]
  E --> F["/simplify 自動 review"]

適合情境

還沒有明確瓶頸、不想先學一套框架。先把原生的用熟,再決定要補什麼。大部分人低估的是 Plan Mode——它改變的不是做事速度,而是和 AI 協作的節奏:讓 AI 先提計畫、你確認再執行,能大幅減少方向跑偏。/batch 是等你有具體需求再學的進階工具,不用急著用。


OpenSpec

在 AI 動 code 之前先對齊規格,留下可追溯的設計決策。

核心功能

  • change 資料夾:每個功能變更建立一個,包含四份 artifacts:proposal.md(為什麼做)、specs/(規格增刪改)、design.md(怎麼做)、tasks.md(實作清單)
  • spec delta:只記錄規格的增刪改,不覆蓋整份文件,reviewer 不用翻 code
  • archive 指令:做完後歸檔到 openspec/changes/archive/YYYY-MM-DD-.../,保留完整歷史紀錄
  • 工具無關:不需要 API key 或 MCP,Claude Code、Cursor、GitHub Copilot 都能搭配

工作流程

graph TD
  A["/opsx:propose"] --> B[產生 proposal/specs/design/tasks]
  B --> C["/opsx:apply"]
  C --> D[執行 tasks]
  D --> E["/opsx:verify(可選)"]
  E --> F["/opsx:archive"]

適合情境

在意可追溯性、設計決策一直消失的情境——不管是 side project 還是多人協作。archive 的價值在時間軸上才顯現:三個月後打開 change folder,「當初為什麼選這個架構」的答案在那裡。


Superpowers

接管整個開發生命週期:從 brainstorming 到 merge,包含強制 TDD。

核心功能

  • Brainstorming skill:問清楚需求,分段讓你 approve 才繼續
  • git worktree 隔離:先建立 feature 級隔離工作空間,再在其中執行 tasks
  • subagent 逐 task 執行:每個 task 2-5 分鐘,獨立 subagent 逐項完成
  • 強制 TDD:先寫 failing test,再寫 code,不可跳過
  • 雙層自動 review:先查 spec compliance(有沒有多做、少做),再查程式品質
  • Skills 自動觸發:agent 自動判斷並強制執行,也可透過對話直接介入調整流程

工作流程

graph TD
  A[brainstorming] --> B[設計確認]
  B --> C[using-git-worktrees]
  C --> D[writing-plans]
  D --> E[逐 task: implementer]
  E --> F[spec compliance review]
  F --> G[code quality review]
  G --> H[finishing-a-development-branch]
  H --> I[merge/PR/保留/丟棄]

適合情境

需要 TDD 保障、可以讓 AI 長時間自主執行的中大型任務。即使小任務也必須走完整流程(設計文件可以很短)——「every project goes through this process. A todo list, a single-function utility, a config change — all of them.」

真正不適合的是「沒時間規劃、必須馬上 push」的緊急 hotfix,問題不在 TDD,而在前置的規劃步驟來不及走。


gstack

28 個 slash commands,其中 20 個是不同角色,補足 solo 開發缺少多視角 review 的問題。

官方自述:Garry Tan(Y Combinator CEO)用這套工具,60 天產出 60 萬行 production code(含 35% 測試)。使用前提是需有 Claude Code 環境,並安裝 Git、Bun(Windows 另需 Node.js)。

核心功能

20 個角色指令(部分):

指令角色用途
/plan-ceo-reviewCEO產品需求視角
/plan-eng-reviewEngineering Manager架構與技術決策
/reviewStaff Engineer程式碼 review
/qaQA Lead測試品質把關
/csoSecurity OfficerOWASP 安全審查

8 個工具與安全護欄:

  • /ship:準備部署流程
  • /browse:啟動真實瀏覽器測試
  • /carefulrm -rfDROP TABLE、force-push 等危險操作前強制確認
  • /freeze:Edit Lock,限制 Claude 只能修改特定目錄,避免除錯時誤改範圍外的程式碼
  • /guard/careful + /freeze 合一的護欄

工作流程

graph TD
  A["/office-hours"] --> B["/plan-ceo-review 或 /autoplan"]
  B --> C["/plan-eng-review"]
  C --> D[實作]
  D --> E["/review"]
  E --> F["/qa ± /cso"]
  F --> G["/ship"]
  G --> H["/retro"]
  D -.高風險操作.-> X["/careful 或 /freeze"]

適合情境

Solo 開發想要多視角把關品質。特別是 /cso Security Officer——它會跑 OWASP Top 10 + STRIDE 威脅建模,這種審計大部分人不會在每個 PR 前手動做一遍,交給 agent 掃更實際。

注意:/guard 管的是 AI 的行為安全(防止誤刪檔案、寫入錯誤目錄),/cso 管的是程式碼本身的安全漏洞——兩個維度不同,不能互相取代。


everything-claude-code

不是工作流框架,是疊在主流 AI coding agent(Claude Code、Cursor、Codex、OpenCode)之上的效能優化層。

Anthropic × Cerebral Valley 舉辦的 Claude Code Hackathon 得獎作品,GitHub 50K+ stars,10+ 個月每日實戰演化出來。28 agents、125 skills、60 commands。

核心功能

  • Memory hooks:自動跨 session 儲存、載入 context,agent 不用每次從零開始
  • Instincts 系統:從每次 session 自動萃取可複用模式,越用越聰明
  • Token 管理:提供 token 優化策略(model routing、context slimming、compact/eval 流程)
  • 安全掃描:提供可啟用的安全審查能力(如 AgentShield/掃描流程)
  • 可疊加:OpenSpec 記規格、everything-cc 記 session context,兩個方向不衝突

工作流程

graph TD
  A[開啟新 session] --> B[memory hooks 載入 context]
  B --> C[執行任務]
  C --> D[instincts 萃取可複用模式]
  D --> E[memory hooks 儲存狀態]
  E --> F[下次 session 自動繼承]

適合情境

Claude Code 一開新 session 就失憶、token 燒得比預期快、同樣的問題一直要反覆解釋。注意:上手門檻最高,光看到「28 agents、125 skills、60 commands」不知道從哪裡開始是正常的;短任務或一次性小改動通常不划算,更適合長週期、多 session 的工作流。裝上去也不代表流程自動變好,還是需要有個主方法論在上面跑。


完整比較

維度Claude Code 原生OpenSpecSuperpowersgstackeverything-cc
主要解決並行執行 + 探索前置規格追溯全流程自動化多角色 reviewcontext 持久化
工作流強制度
適合任務大小任何任何中~大型任何任何
TDD 支援強制有(/qa
跨 session 記憶CLAUDE.mdspec archivememory hooks
安裝需求安裝 CLI安裝 skill pack安裝 skill pack安裝框架
上手時間即刻約 1 小時約半天約 2 小時數天
可與其他工具疊加⚠️ 部分重疊

如何選擇

根據你現在最卡的瓶頸選,不是根據功能多寡:

你的主要瓶頸建議工具原因
還沒有明確瓶頸Claude Code 原生Plan Mode + /batch 已解決大部分問題,零額外成本
設計決策一直消失,review 越來越難OpenSpecspec delta + archive 讓三個月後還看得懂
想要全流程 TDD 保障Superpowers唯一強制 TDD 的框架,不可跳過
Solo 開發沒人 reviewgstack20 個角色視角補足盲點,Security 特別有用
Context 一直丟失、token 燒太快everything-ccmemory hooks 解決跨 session 失憶
規格 + context 都要OpenSpec + everything-cc兩個方向不重疊,可以疊加

⚠️ 避免組合:OpenSpec + Superpowers 同時用——兩者的 brainstorming + planning 高度重疊,流程反而更重。選一個主框架,另一個補足它不擅長的地方。


我的選擇

目前用 OpenSpec + Claude Code 原生,加上 Plan Mode。

選 OpenSpec 的原因很實際:最大的痛點是設計決策會消失,OpenSpec 讓每個 change 都留下 proposal 和 design,這個問題基本上消失了。Plan Mode 是零成本的安全帶,任何任務都先開;大規模改動用 /batch

Superpowers 的流程太重,大部分任務不值得走這套流程;gstack 的多角色 review 吸引人,但 28 個 commands 需要時間建立習慣;everything-cc 等哪天 agent 效能真正成為瓶頸再說。問題不是「哪個工具最強」,而是「你現在最卡在哪裡」。


參考來源



Logan

資深軟體工程師,熱衷寫程式與智慧家庭 🏠

本文採用 CC BY-NC 4.0 授權


分享:


相關文章


輸入關鍵字搜尋文章