2026 年決定 AI 產出品質的,已經不是你怎麼問,而是你在它回答之前餵了什麼進去。 Prompt engineering 處理「怎麼寫好一句指令」;context engineering 處理「整個 token payload 怎麼被策劃、維護、跨多輪迭代」——涵蓋 system prompt、工具定義、記憶檔、檢索文件、對話歷史。前者是後者的一個子集。這是 Anthropic 的官方立場(Effective context engineering),也是 Karpathy 2025 年推廣此詞時的核心觀點。
核心原則:找「最小但高訊號密度」的 token 集合
反直覺、但被官方文件與嚴謹研究反覆印證的一句話:多不等於好,context window 越大不代表可以隨便塞。 真正決定品質的是高訊號密度的最小集合,而不是最大 token 量。
支撐這個原則的研究非常硬:
- Context rot:Chroma 測試 18 個前沿模型,效能都隨輸入變長「非均勻」劣化,且常在遠低於官方標示上限時就開始掉(Chroma)。
- Lost in the middle:關鍵資訊放在 context 中段時準確率最低(arXiv:2307.03172)。
- NoLiMa:拿掉字面關鍵字重疊、強迫語意推理後,13 個模型有 11 個在僅 32K tokens 就掉到短 context 表現的 50% 以下(arXiv:2502.05167)。
- 即使檢索完美,光是輸入變長本身就讓表現降 13.9–85%(arXiv:2510.05381)。
實務結論:把「有效 context 預算」抓在官方標示上限的 25–30%,別假設能用滿。
Best practices(可操作)
- CLAUDE.md / 規則檔要短、可執行、只放不可推測的資訊。官方建議控制在 200 行內,逐行自問「拿掉這行會不會讓 AI 犯錯?」不會就刪(官方 memory 文件、best-practices)。該放:非預設的 bash 指令、風格規則、測試指示、架構決策、常見陷阱;不該放:程式碼可推斷的事、標準慣例、大段 API 文件(改放連結)、常變資訊。
- 偶爾才需要的知識放進 Skills(隨需載入),不要塞進每次都載入的 CLAUDE.md。
- Just-in-time 檢索優於預先塞滿:放檔案路徑/查詢字串,執行時再用工具即時載入,而非把整包資料貼進去。
- 用 sub-agent 做脈絡隔離:把耗 token 的探索丟給子代理,各自獨立 context window,只把濃縮結論帶回主線——詳見 Agentic Workflow。
- 強制規則用 hooks,不要用文字期待模型自律。屢次被無視的規則,通常代表檔案太長把它淹沒了。
工具與工作流
- 編碼助手的脈絡機制:Claude Code 的
CLAUDE.md+ 自動記憶 +.claude/rules/(依路徑條件載入);Cursor Rules(.mdc)+ Memories;Windsurf Cascade Memories。 - AGENTS.md 正成為跨工具、供應商中立的規則檔標準,2025-12 併入 Linux Foundation 的 Agentic AI Foundation(公告、GitHub 分析 2500+ repo)。
- 記憶框架:Mem0、Letta/MemGPT(三層記憶)、Zep + Graphiti(時序知識圖譜)。
- 真實案例:Uber 把內部 on-call 助手從傳統 RAG 換成 agentic RAG,可接受答案 +27%、錯誤建議 −60%(Uber blog)。
實踐步驟
- 審計你的 CLAUDE.md/AGENTS.md,逐行做「拿掉會不會犯錯」測試,砍到 200 行內。
- 把偶用知識搬到 Skills,常用規則留 CLAUDE.md。
- 大段文件改成「連結+查詢方式」,讓 AI 即時檢索。
- 長任務拆 sub-agent,各自乾淨 context,只回傳濃縮結論。
- 規劃時把有效預算抓在上限 25–30%;接近上限用內建 compaction 摘要,並意識到摘要可能遺失早前的限制。
主張 vs 可佐證
- 可佐證:官方定義、context rot(18 模型)、lost-in-the-middle、NoLiMa、CLAUDE.md 200 行建議、AGENTS.md 入 Linux Foundation——皆有官方文件或同儕審查論文。
- 主張/行銷:「治理化 context 讓準確率達 94–99%」「90% 成功率靠 context 而非模型」多來自賣相關產品的廠商部落格,無公開方法論,不宜當硬數據。
- 證據缺口:context engineering 作為獨立學科邊界尚無共識;繁中獨立研究幾乎缺席。
這是所有 AI 技能的地基。下一步請看怎麼「下對 brief」:與 AI 協作的委任溝通術;想量化「脈絡改了到底有沒有變好」,接 Evals。工程場景的延伸見 Engineering AI Coding Methodology。