AI-Native 產品開發：一人團隊從 prototype 到上線的完整打法

「加個 AI 功能」和「整個產品圍繞 AI 重新設計」是兩件事——後者才是 2026 年最值錢的創業技能。 判準很簡單（拿掉測試法）：把 AI 元件全拿掉，若產品仍能運作只是變笨，是 AI-enhanced；若直接無法運作，才是 AI-native。AI-native 從第一天就圍繞模型、資料管線、回饋迴圈設計。

核心方法

以不確定性為中心的 UX：AI 產品經理的核心工作被重新定義為「管理不確定性」——不確定性從哪進入體驗？系統答錯時會怎樣？使用者在哪些地方被要求信任他們無法評估的輸出？具體手法：不確定性指示器、來源新鮮度標籤（如 Perplexity），目標是「校準恰當程度的信任」而非假裝全知。
Human-in-the-loop 是光譜不是開關：草擬 email 可全自動，發送金錢相關動作保留人類最終按鈕；依風險等級分配不同顆粒度。警惕 Review Fatigue——設計「稽核介面」把 agent 50 步思維鏈壓成一個可一眼判斷的信心檢查點。
Eval 驅動的產品迭代（EDD）：「先寫 eval 再寫 prompt」，類比 TDD。prompt 迭代幾乎每天發生，eval 防迴歸——詳見 Evals。
一人團隊的最小可行動作：上線前先手動整理 20–100 筆「黃金樣本」（輸入/預期輸出）——這是本主題認為報酬比最高、幾乎零成本、第一週就該做的單一實踐。它讓「這次改動是變好還是變壞」從玄學變成可衡量問題。

從 demo 到 production 的四階段管線

多數 vibe-coded 產品在生產環境暴死，是因為跳過了中間兩步：

稽核 AI 實際寫出的東西（不是無腦接受）。
打硬「無聊」的基礎設施：auth、rate limit、secrets、錯誤處理。
觀察正式環境的實際運作。
部署在 sandbox / staged rollout 後方。

核心結論：「vibe coding 能不能建出產品」不是問題（顯然能）；問題是「能不能維護一個產品」——目前答案是不行，除非補上第 2–4 階段。2026 年「prompt engineering」已演化為「specification engineering」：呼叫 AI 前先寫結構化簡報（範圍/限制/驗收），呼應 Spec-Driven。

Demo 能跑 ≠ 可上線（關鍵陷阱）

一份 650 位企業主管的調查：78% 已有 agent 試點，但只有 14% 達生產規模。demo 中 90% 成功率看起來很神奇；生產中 10% 失敗率是災難。 三個生產殺手：長工具鏈的複合誤差、責任歸屬模糊、demo 不會展示的「無聊整合工作」。緩解：設「監督 agent」——不做實際工作，只依業務規則驗證每一步輸出。
幻覺傷信任：AI 生成的產品規格/法律文字/金額都是對客戶的承諾，一旦不符即「食言」（有案例因規格幻覺退貨率 +25%）。任何直接呈現給使用者的 AI 內容走「AI 產出 + 人類/規則層複核」雙層設計。

護城河：包裝 GPT 沒有護城河

核心判準：「如果 OpenAI/Anthropic 明天發布這個功能，我還剩什麼？」答案若只是「prompt 寫得比較好」，就沒有護城河——2026 年好 prompt 是全世界最容易被複製的東西。
真正撐得住的機制：專屬資料、深度工作流整合、使用者資料複利（機構記憶）、網路效應。
正面案例 Granola（AI 會議筆記，2026 C 輪 $125 M 、估值$ 15 億、當季營收 +250%）：轉錄背景無聲運行、AI 只補到 80–85% 保留人類判斷、「Recipes」把會議當觸發點自動串下游動作、團隊層級記憶累積成機構記憶——護城河來自工作流深度與資料複利，而非轉錄技術本身。Cursor 同理（技術上是 wrapper，但護城河在 agent+editor+model 三位一體）。
反面 Jasper：護城河只有 prompt + 模板，ChatGPT 功能升級後用戶流失，營收從 2023 峰值 $1.2 億降至 2024 約$ 3,500–5,500 萬。

AI-native 的具體設計模式（跨案例歸納）

背景運行、無感知介入（不打斷原有行為）。
AI 產出 80–85%、人類收尾（降幻覺風險敞口）。
觸發式下游工作流（把一場會議/一次對話當觸發點自動串接，而非局限在問答框）。
機構記憶/資料複利（撐住護城河論述的少數機制之一）。

主張 vs 可佐證

可佐證：拿掉測試判準；EDD/evals engineering；hybrid 定價 41% 採用（Bessemer）、outcome-based 實例（Zendesk/Intercom）；pilot-to-production 14%/78% 統計；Granola 融資與客戶名單。
中等（媒體轉述）：Polsia「30 天 $1 M A R R 」（僅一次 p o d c a s t 發言）、 J a s p er 營收下滑、 M e d v i$ 401M、Levelsio 營收。
弱／行銷：「80–95% AI wrapper 失敗」「80% AI 新創將倒閉」（方法論不透明、互相轉述）、Dario Amodei「70–80% 機率 2026 出現一人十億美元公司」（個人預測）、BCG「AI-native 三年成本低 40%」（無一手報告連結）。
缺口：繁中/台灣本地 AI-native 一手案例完全缺席；大量「2026 趨勢」文疑似同源內容農場。

產品迭代的引擎是 Evals；上線前的規格化見 Spec-Driven；毛利結構見成本與 Model Routing；商業護城河的完整論述見 AI 時代護城河；工程實作面見 AI Agentic SaaS。

我的知識庫

探索