「加個 AI 功能」和「整個產品圍繞 AI 重新設計」是兩件事——後者才是 2026 年最值錢的創業技能。 判準很簡單(拿掉測試法):把 AI 元件全拿掉,若產品仍能運作只是變笨,是 AI-enhanced;若直接無法運作,才是 AI-native。AI-native 從第一天就圍繞模型、資料管線、回饋迴圈設計。
核心方法
- 以不確定性為中心的 UX:AI 產品經理的核心工作被重新定義為「管理不確定性」——不確定性從哪進入體驗?系統答錯時會怎樣?使用者在哪些地方被要求信任他們無法評估的輸出?具體手法:不確定性指示器、來源新鮮度標籤(如 Perplexity),目標是「校準恰當程度的信任」而非假裝全知。
- Human-in-the-loop 是光譜不是開關:草擬 email 可全自動,發送金錢相關動作保留人類最終按鈕;依風險等級分配不同顆粒度。警惕 Review Fatigue——設計「稽核介面」把 agent 50 步思維鏈壓成一個可一眼判斷的信心檢查點。
- Eval 驅動的產品迭代(EDD):「先寫 eval 再寫 prompt」,類比 TDD。prompt 迭代幾乎每天發生,eval 防迴歸——詳見 Evals。
- 一人團隊的最小可行動作:上線前先手動整理 20–100 筆「黃金樣本」(輸入/預期輸出)——這是本主題認為報酬比最高、幾乎零成本、第一週就該做的單一實踐。它讓「這次改動是變好還是變壞」從玄學變成可衡量問題。
從 demo 到 production 的四階段管線
多數 vibe-coded 產品在生產環境暴死,是因為跳過了中間兩步:
- 稽核 AI 實際寫出的東西(不是無腦接受)。
- 打硬「無聊」的基礎設施:auth、rate limit、secrets、錯誤處理。
- 觀察正式環境的實際運作。
- 部署在 sandbox / staged rollout 後方。
核心結論:「vibe coding 能不能建出產品」不是問題(顯然能);問題是「能不能維護一個產品」——目前答案是不行,除非補上第 2–4 階段。2026 年「prompt engineering」已演化為「specification engineering」:呼叫 AI 前先寫結構化簡報(範圍/限制/驗收),呼應 Spec-Driven。
Demo 能跑 ≠ 可上線(關鍵陷阱)
- 一份 650 位企業主管的調查:78% 已有 agent 試點,但只有 14% 達生產規模。demo 中 90% 成功率看起來很神奇;生產中 10% 失敗率是災難。 三個生產殺手:長工具鏈的複合誤差、責任歸屬模糊、demo 不會展示的「無聊整合工作」。緩解:設「監督 agent」——不做實際工作,只依業務規則驗證每一步輸出。
- 幻覺傷信任:AI 生成的產品規格/法律文字/金額都是對客戶的承諾,一旦不符即「食言」(有案例因規格幻覺退貨率 +25%)。任何直接呈現給使用者的 AI 內容走「AI 產出 + 人類/規則層複核」雙層設計。
護城河:包裝 GPT 沒有護城河
- 核心判準:「如果 OpenAI/Anthropic 明天發布這個功能,我還剩什麼?」答案若只是「prompt 寫得比較好」,就沒有護城河——2026 年好 prompt 是全世界最容易被複製的東西。
- 真正撐得住的機制:專屬資料、深度工作流整合、使用者資料複利(機構記憶)、網路效應。
- 正面案例 Granola(AI 會議筆記,2026 C 輪 15 億、當季營收 +250%):轉錄背景無聲運行、AI 只補到 80–85% 保留人類判斷、「Recipes」把會議當觸發點自動串下游動作、團隊層級記憶累積成機構記憶——護城河來自工作流深度與資料複利,而非轉錄技術本身。Cursor 同理(技術上是 wrapper,但護城河在 agent+editor+model 三位一體)。
- 反面 Jasper:護城河只有 prompt + 模板,ChatGPT 功能升級後用戶流失,營收從 2023 峰值 3,500–5,500 萬。
AI-native 的具體設計模式(跨案例歸納)
- 背景運行、無感知介入(不打斷原有行為)。
- AI 產出 80–85%、人類收尾(降幻覺風險敞口)。
- 觸發式下游工作流(把一場會議/一次對話當觸發點自動串接,而非局限在問答框)。
- 機構記憶/資料複利(撐住護城河論述的少數機制之一)。
主張 vs 可佐證
- 可佐證:拿掉測試判準;EDD/evals engineering;hybrid 定價 41% 採用(Bessemer)、outcome-based 實例(Zendesk/Intercom);pilot-to-production 14%/78% 統計;Granola 融資與客戶名單。
- 中等(媒體轉述):Polsia「30 天 401M、Levelsio 營收。
- 弱/行銷:「80–95% AI wrapper 失敗」「80% AI 新創將倒閉」(方法論不透明、互相轉述)、Dario Amodei「70–80% 機率 2026 出現一人十億美元公司」(個人預測)、BCG「AI-native 三年成本低 40%」(無一手報告連結)。
- 缺口:繁中/台灣本地 AI-native 一手案例完全缺席;大量「2026 趨勢」文疑似同源內容農場。
產品迭代的引擎是 Evals;上線前的規格化見 Spec-Driven;毛利結構見 成本與 Model Routing;商業護城河的完整論述見 AI 時代護城河;工程實作面見 AI Agentic SaaS。