傳統 SaaS 的核心是規則引擎:用戶觸發,系統按照工程師預先寫死的邏輯執行。Agentic SaaS 的核心是語言模型作為決策引擎:工程師定義工具和邊界,LLM 在執行時動態決定「做什麼」「怎麼做」「何時停止」。這個差別看起來是技術實作的改變,實際上改變了整個產品的可預測性、成本結構與除錯方式。

傳統 SaaS vs Agentic SaaS:核心差別

維度傳統 SaaSAgentic SaaS
執行邏輯工程師寫死的規則與流程LLM 動態推理+工具調用
輸出特性確定性(相同輸入→相同輸出)非確定性(相同 prompt 可能產生不同結果)
失敗模式Exception/Error,有 stack trace幻覺、幻覺工具調用、意外的 agent loop
成本結構以固定基礎建設成本為主加上隨使用量線性增長的 LLM token 費用
除錯工具Logs、traces、debugger需要 LLM observability 工具(traces+prompt logs+span)
可審計性程式碼即決策邏輯,100% 可追溯每次推理是黑盒,需要額外記錄

關鍵在於「誰在做決策」。傳統 SaaS 是工程師決策(以程式碼的形式固化),Agentic SaaS 是 LLM 決策(以每次推理的形式動態生成)。這不是改進,是取捨——換來的是更靈活的自然語言介面與更強的泛化能力,換掉的是確定性與完整可審計性。

三種 Agentic 程度

業界對「多 Agentic」有不同切法,以下是一種流傳較廣的粗分(這是主張,不是標準,不同文獻用語不一致):

Copilot 模式 AI 建議,人決定。GitHub Copilot 的程式碼建議、Grammarly 的改寫建議屬於此類。LLM 介入在「建議」層,不執行任何有副作用的操作(不寫入資料庫、不發 API call)。延遲容忍度較高,成本相對可控,出錯後果由人類決策吸收。

Agent 模式 AI 執行多步驟操作,人在關鍵節點審核(human-in-the-loop)。多步驟法律文件審查、AI 客服升級到人工客服的判斷路徑、Devin 類 AI 工程師屬於此類。LLM 直接觸發工具調用(API call、資料庫寫入、email 發送),但在高風險動作前需要人類確認。

Autopilot 模式 AI 全自動執行,人設定邊界,事後稽核。排班優化、財務對帳自動化、定時監控報告屬於此類。需要嚴格的 guardrail、冪等性設計、完整 audit log。大部分商業 Agentic SaaS 不選擇把高風險業務放在這層。

大部分成熟的商業 Agentic SaaS 停留在 Agent 模式(有 human-in-the-loop);Autopilot 多用在低風險、高重複性的後台任務。

從 Prompt 到多步驟工作流:四層建構路徑

第一層:Prompt Only 最基本型態:一個 system prompt+user input → 一個 LLM 回應。適合生成文案、翻譯、簡單問答。無工具,無狀態,每次對話獨立。成本和延遲最低,但不能執行任何外部操作。

第二層:Tool Use(Function Calling) LLM 在回應中輸出「我要調用哪個工具、帶什麼參數」的決策,宿主程式執行後把結果傳回給 LLM。Anthropic 和 OpenAI 均以 JSON Schema 定義工具的 name、description、input_schema;模型在推理時讀懂描述後自行決定要不要調用、怎麼調用。工具描述的品質直接影響調用準確度——這是個可佐證的工程事實:模糊的工具描述顯著提高錯誤調用率。

第三層:Agent Loop(ReAct Pattern) LLM 進入「推理 → 行動 → 觀察 → 再推理」的迴圈,直到任務完成或達到終止條件。ReAct(Reason+Act)是 Yao et al. 2022 年提出的框架,現已成為主流 agent 的基礎模式(原論文)。每次迭代:LLM 看到當前狀態 → 決定下一步行動 → 執行工具 → 把結果加入上下文 → 繼續推理。終止條件必須明確設定:迴圈本身沒有自然的結束點,若 LLM 判斷失誤會持續調用工具,最終耗盡 token 預算或產生巨額帳單。

第四層:多步驟工作流(Multi-step Workflow) 多個 agent 或 LLM 調用分工協作,由明確的狀態機或圖形控制流管理執行順序。LangGraph 用 directed graph 管理這一層:節點是 agent 或工具調用,邊是狀態轉移條件,全局共享一個 state 物件(LangGraph 文件)。適合需要平行執行、條件分支、或「子任務結果匯聚」的複雜業務流程。代價是顯著更高的複雜度、更難除錯的執行路徑。

不確定性的邊界

「Agentic SaaS」不是業界有統一定義的術語。市面上的描述從「任何帶 AI 功能的 SaaS」到「完全自主的 AI 工作者」都有人這樣稱呼。工程上比較有用的問法是:這個系統裡 LLM 的決策深度到哪裡?有幾層 agent loop?工具調用有副作用嗎?有沒有 human-in-the-loop? 這些問題比標籤更能描述系統的真實特性與風險。

延伸