Technology Radar 是 Thoughtworks 每半年出一次的技術評鑑報告。Vol.34(2026 年 4 月)的核心主題是:「AI 加快了程式碼生成,卻加深了認知債——是時候回歸工程基本功了。」 這篇把 Vol.34 中所有 AI 相關 blip 整理成可操作的判讀清單,附每個評等背後的工程理由。

核心主題:AI 認知債(Codebase Cognitive Debt)

Thoughtworks 在 Vol.34 新增了「Codebase cognitive debt」作為 Caution blip:

「隨著 AI 增加變更速度,實作與團隊理解之間的鴻溝在擴大,讓開發者愈來愈難以有效引導 agent。」

這是一個反直覺的警告:AI 生的程式碼越多,工程師越可能失去對系統的理解;失去理解的工程師更難有效指揮 AI——形成惡性循環。 這也是為什麼 Vol.34 把「回歸工程基本功」當作主題,而不是加碼更多 AI 工具。

Adopt(立即採用)

Thoughtworks 已在多個客戶案例驗證,認為現在就可以在大多數情境採用

Blip核心理由
Claude Code2026 年 agent 工具的代表性成熟產品;supervised agentic mode 已被廣泛驗證
CursorAI 編碼 IDE 的領先者;plan mode、hooks、subagent 讓它成為完整的 agentic 環境
Context engineering把 context 視窗當設計面;progressive context disclosure 已成為 AI 編碼的核心紀律
Curated shared instructionsCLAUDE.md / AGENTS.md 等——把 AI 引導固化進 service template;讓 AI 輔助在整個團隊一致且高品質
DORA metricsAI 時代生產力不能用行數衡量;lead time / deploy freq / MTTR / change failure rate / rework rate 是真正的量測工具
Structured output from LLMs限制模型輸出預定義格式(JSON、class),用 Instructor / Pydantic AI,讓 AI 輸出可靠地程式化消費
Zero trust architecture「永遠驗證、絕不信任」——在 agent 部署中應用,使用 SPIFFE 和 OIDC impersonation 的短期 token

Trial(值得投資試驗)

有足夠跡象顯示值得,但仍需要在能容忍一定風險的專案上試驗:

Blip核心理由
Agent Skills把 instructions / scripts / 資源打包成模組;減少 token 消耗,防指令膨脹
Feedback sensors for coding agents把 compiler / linter / tests 接進 agentic workflow,讓失敗觸發自我修正
Progressive context disclosureAgent 先輕量探索再選需要的資訊,而非一次前置所有 context
Sandboxed execution for coding agents隔離環境執行,限制檔案存取、網路和資源——安全基本線,不只是實驗性技術
Mutation testing刻意注入 bug 驗證測試集——在評估 AI 生成的測試時格外重要(AI 測試覆蓋率高但不一定真的能抓問題)
Mapping code smells to refactoring techniques透過 Agent Skills / AGENTS.md 指示 agent 針對特定 code smell 採用定義好的重構手法
Team of coding agents有角色分工的小型 agent 組;Claude Code 已有 orchestration 支援,但組成仍需謹慎
Browser-based component testingPlaywright 等工具在真實瀏覽器測試的成熟度已可取代模擬環境

Assess(值得持續觀察)

技術本身有潛力,但仍不夠成熟,先做評估、不宜大規模採用:

Blip說明
Architecture drift reduction with LLMs結合確定性分析工具與 LLM 評估,偵測 AI 輔助開發引入的架構違規
Context graph把決策、政策、例外和先例建模成相連節點,讓 agent 做機器可讀的機構推理
Feedback flywheel捕捉 coding agent session 的成功與失敗,持續改善 prompt、指令和感測器
Code intelligence as agentic tooling給 agent 存取 AST-aware 工具(LSP、OpenRewrite codemods),而非依賴文字搜尋
Ralph loop單一 agent 以新鮮 context 視窗反覆從 spec 選取任務——避免長 session 中 context 累積的品質下滑
MITRE ATLASAI / ML 系統的對抗性戰術知識庫,提供 threat modeling agentic 部署的共同詞彙
Measuring collaboration quality with coding agents追蹤 first-pass 接受率、迭代次數、重工量和審查負擔,而非只是速度
Toxic flow analysis for AI檢查 agentic 系統中的不安全資料路徑和攻擊向量,特別針對高權限 agent 和惡意 Skills
Small language models(SLMs)比 LLM 更有成本效益,在摘要和基本編碼任務上已改善;distillation 和 quantization 持續提升
Agentic reinforcement learning environments結合脈絡、工具和反饋的訓練環境;multi-step agentic 任務的獎勵式後訓練
Skills as executable onboarding documentation用 Agent Skills 做 setup、API 文件和 platform onboarding,結合腳本與 LLM 語義

Caution(要小心的)

Thoughtworks 明確警告,或說「若要繼續用,需要充分理由」:

Blip為什麼要小心
Agent instruction bloat指令隨時間堆積、互相衝突;模型對深埋內容注意力下降;手寫版本通常優於 LLM 生成版本
AI-accelerated shadow ITAI 降低了非工程師建立 agentic workflow 的門檻,但缺乏治理,造成安全漏洞和方案重複
Codebase cognitive debtAI 加深了理解鴻溝;工程師對系統的理解減少,引導 agent 的能力也隨之降低——惡性循環
Coding agent swarms動態部署數十到數百個 agent;成本仍高、技術不成熟;只適合問題規格明確且測試套件完整的場景
Coding throughput as productivity單純的行數和 PR 數掩蓋了隱性重工、糟糕的 review 流程和安全風險;和 CircleCI 2026 數據完全吻合
Ignoring durability in agent workflowsAgent 若沒有狀態持久化,網路中斷就會造成不完整狀態;應使用 durable execution 框架
MCP by default加入 MCP 的抽象 overhead 不一定值得;簡單的 CLI 通常對 agent 整合有足夠精確度
Pixel-streamed development environmentsVDI 式遠端桌面造成延遲摩擦、影響 flow;雲端開發環境(Codespaces 等)通常是更好的選擇

如何閱讀 Radar 評等

閱讀這份清單的原則:

  • Adopt 不是「所有人都必須用」,而是「對大多數適合的情境,採用風險已足夠低」
  • Trial 是「值得投資理解,可在低風險專案上試驗」——不是「可以直接上 production」
  • Caution 是警告而非禁令,但需要充分理由才能繼續
  • 評等是 Thoughtworks 的工程意見,基於客戶工作和技術觀察——不是學術研究,也不是全球數據的統計結論

來源: