Context Engineering（情境工程）：餵對脈絡比下對 prompt 更關鍵

2026 年決定 AI 產出品質的，已經不是你怎麼問，而是你在它回答之前餵了什麼進去。 Prompt engineering 處理「怎麼寫好一句指令」；context engineering 處理「整個 token payload 怎麼被策劃、維護、跨多輪迭代」——涵蓋 system prompt、工具定義、記憶檔、檢索文件、對話歷史。前者是後者的一個子集。這是 Anthropic 的官方立場（Effective context engineering），也是 Karpathy 2025 年推廣此詞時的核心觀點。

核心原則：找「最小但高訊號密度」的 token 集合

反直覺、但被官方文件與嚴謹研究反覆印證的一句話：多不等於好，context window 越大不代表可以隨便塞。 真正決定品質的是高訊號密度的最小集合，而不是最大 token 量。

支撐這個原則的研究非常硬：

Context rot：Chroma 測試 18 個前沿模型，效能都隨輸入變長「非均勻」劣化，且常在遠低於官方標示上限時就開始掉（Chroma）。
Lost in the middle：關鍵資訊放在 context 中段時準確率最低（arXiv:2307.03172）。
NoLiMa：拿掉字面關鍵字重疊、強迫語意推理後，13 個模型有 11 個在僅 32K tokens 就掉到短 context 表現的 50% 以下（arXiv:2502.05167）。
即使檢索完美，光是輸入變長本身就讓表現降 13.9–85%（arXiv:2510.05381）。

實務結論：把「有效 context 預算」抓在官方標示上限的 25–30%，別假設能用滿。

Best practices（可操作）

CLAUDE.md / 規則檔要短、可執行、只放不可推測的資訊。官方建議控制在 200 行內，逐行自問「拿掉這行會不會讓 AI 犯錯？」不會就刪（官方 memory 文件、best-practices）。該放：非預設的 bash 指令、風格規則、測試指示、架構決策、常見陷阱；不該放：程式碼可推斷的事、標準慣例、大段 API 文件（改放連結）、常變資訊。
偶爾才需要的知識放進 Skills（隨需載入），不要塞進每次都載入的 CLAUDE.md。
Just-in-time 檢索優於預先塞滿：放檔案路徑／查詢字串，執行時再用工具即時載入，而非把整包資料貼進去。
用 sub-agent 做脈絡隔離：把耗 token 的探索丟給子代理，各自獨立 context window，只把濃縮結論帶回主線——詳見 Agentic Workflow。
強制規則用 hooks，不要用文字期待模型自律。屢次被無視的規則，通常代表檔案太長把它淹沒了。

工具與工作流

編碼助手的脈絡機制：Claude Code 的 CLAUDE.md + 自動記憶 + .claude/rules/（依路徑條件載入）；Cursor Rules（.mdc）+ Memories；Windsurf Cascade Memories。
AGENTS.md 正成為跨工具、供應商中立的規則檔標準，2025-12 併入 Linux Foundation 的 Agentic AI Foundation（公告、GitHub 分析 2500+ repo）。
記憶框架：Mem0、Letta/MemGPT（三層記憶）、Zep + Graphiti（時序知識圖譜）。
真實案例：Uber 把內部 on-call 助手從傳統 RAG 換成 agentic RAG，可接受答案 +27%、錯誤建議 −60%（Uber blog）。

實踐步驟

審計你的 CLAUDE.md／AGENTS.md，逐行做「拿掉會不會犯錯」測試，砍到 200 行內。
把偶用知識搬到 Skills，常用規則留 CLAUDE.md。
大段文件改成「連結＋查詢方式」，讓 AI 即時檢索。
長任務拆 sub-agent，各自乾淨 context，只回傳濃縮結論。
規劃時把有效預算抓在上限 25–30%；接近上限用內建 compaction 摘要，並意識到摘要可能遺失早前的限制。

主張 vs 可佐證

可佐證：官方定義、context rot（18 模型）、lost-in-the-middle、NoLiMa、CLAUDE.md 200 行建議、AGENTS.md 入 Linux Foundation——皆有官方文件或同儕審查論文。
主張／行銷：「治理化 context 讓準確率達 94–99%」「90% 成功率靠 context 而非模型」多來自賣相關產品的廠商部落格，無公開方法論，不宜當硬數據。
證據缺口：context engineering 作為獨立學科邊界尚無共識；繁中獨立研究幾乎缺席。

這是所有 AI 技能的地基。下一步請看怎麼「下對 brief」：與 AI 協作的委任溝通術；想量化「脈絡改了到底有沒有變好」，接 Evals。工程場景的延伸見 Engineering AI Coding Methodology。

我的知識庫

探索