Danny 2026-05-12

為什麼企業的AI專案一直失敗？產品設計的信任危機

文章摘要

為什麼 AI 助理越來越厲害，但人們對它的信任感卻沒有等比例增長？如何替 AI 建立行為邊界與驗收機制

我最近一直在想一個問題：為什麼 AI 助理越來越厲害，但人們對它的信任感卻沒有等比例增長？

本文的判斷是：產品設計的核心戰場已經從「好不好用」轉移到「值不值得信」。設計師現在要做的不是優化畫面流程，而是替 AI 建立行為邊界與驗收機制——定義它可以做什麼、什麼情況要先讓人看過、什麼動作絕對不能碰。這個轉變正在發生，但業界還沒準備好面對它的代價。

AI 採用在加速，但信任基礎在倒退

Stanford HAI 的 2026 AI Index Report 提出了一組讓人不舒服的數字：生成式 AI 三年內達到 53% 的人口採用率，這個速度超越了 PC 和網路的擴散；但與此同時，Foundation Model 的透明度指數從 58 分跌到了 40 分，下降幅度超過三成。

更讓人擔心的是：透明度跌得最多的，往往是能力最強的那些模型。能力越強，揭露越少。

這不只是研究機構的觀測。McKinsey 調查了約 500 家組織，發現 AI 採用率已達 88%，但 62% 的組織還停在實驗階段，只有 39% 在企業層面看到實際的財務影響（EBIT），自評部署「成熟」的大約只有 1%。廣泛採用加上極低成熟度，說明大多數組織的 AI 助理目前仍是鬆散的功能外掛，而非真正整合進工作流程的可信工具。

Gartner 的預警更直接：任務型代理 AI 在企業應用中的佔比預計在一年內從不到 5% 跳升到 40%，但同時，超過 40% 的代理 AI 專案預計在 2027 年前被取消——原因不是技術跑不動，而是使用者根本不信任系統、不理解系統在做什麼，選擇直接放棄。

這個數字差距揭示了一個結構性問題：代理 AI 的部署速度，遠遠超過了使用者信任的建立速度。

Gartner 的具體警告是：即使技術本身可以運作，使用者看不懂系統在做什麼、不知道如何控制、也不確定系統是否可信，就會直接放棄。許多組織押注代理 AI 卻未配套設計使用者理解路徑——這是系統性的產品決策錯誤，而非技術問題。

設計師的工作已經換了一種專業

EY Studio 和 Nielsen Norman Group 都在討論同一件事：代理時代的設計師，工作內容已經從「畫靜態線框」轉向「設計行為模型與信任協議」。

EY 的說法是，設計師未來的職稱可能是「意圖架構師（Intent Architect）」——不是設計介面元件，而是設計 AI 在什麼條件下可以自主行動、什麼情況必須先告知使用者、AI 的個性與語氣如何跟品牌一致。

Smashing Magazine 整理了目前最有效的信任設計模式：「意圖預覽（Intent Preview）」。在 AI 採取行動之前，先向使用者展示它計劃做什麼，並提供三個選項：讓它執行、讓我修改、讓我自己來。這是一個把黑箱系統轉為透明可控體驗的核心機制——某種程度上，這就是替 AI 建立的人工守門機制。

從我自己的產品開發經驗來看，這個轉變的本質是：當 AI 從「回應工具」變成「代理行為者」，設計師的責任就從優化互動流程，變成設計驗收機制——哪些動作 AI 做完直接算數、哪些要送給人確認再生效、哪些邊界根本不能靠近。

三個你不得不選邊的產品取捨

固定介面 vs. 生成介面：掌控感的代價

NN/G 指出生成 UI 的三種落地模式：靜態控制型、聲明式、開放式。開放式最靈活，但最難維護使用者對產品行為的預期。Apple 的官方 HIG 並未擁抱開放式生成 UI，明確要求 AI 內容必須與使用者內容有視覺區分、代理行為的信心程度需要明確溝通、使用者對代理已執行及計劃執行的動作必須有真實可理解的控制權。

EY 陣營主張設計師轉為設計「約束條件」，讓 AI 在邊界內自由生成；Apple 的立場是：生成 UI 的品質連設計師自己都無法穩定判斷，固定介面才能保護使用者對產品行為的預期。這個取捨的核心問題是：個性化帶來的彈性，和可預測性帶來的信任，能不能同時存在？

代理自主度 vs. 可解釋性

UXmatters 提出信任的四個要素：可預測性、透明度、控制感、可靠性。這四件事在代理 AI 身上都有張力——自主度越高，可解釋性越難維持；行動速度越快，使用者的控制感越弱。台灣 UX 從業者 Lydia Chuang 也觀察到，2026 年衡量 UX 成功的標準已從「易用性」升級為「信任感、即時性、感官層次」，可解釋 AI 的「邏輯追溯」功能成為在地產品評比的新維度。

AI 當核心體驗，還是功能外掛？

NN/G 明確說：「AI 驅動」不是價值主張，把 AI 設為核心體驗會讓使用者不知道產品能為他們做什麼，最終傾向加入範圍最廣的聊天機器人功能，反而製造出採用門檻最高、使用者最不清楚該如何使用的產品。EY 陣營則認為不把 AI 設為核心就無法充分釋放代理能力。這個決策背後的真正問題是：你的產品是在解決一個使用者已知的問題（外掛合適），還是在創造使用者還不知道自己需要的使用方式（核心體驗必要）？

業界反方觀點：問題比「設計信任」更深

NN/G：「AI 驅動」是設計債務的起點，不是賣點

Nielsen Norman Group 明確指出，當「它有 AI」成為產品的核心訴求時，設計團隊會失去使用者需求的錨點，最終傾向加入最廣泛的聊天機器人功能，製造出使用門檻最高、價值最模糊的設計決策。NN/G 的立場是：應先確定使用者的具體目標，再決定 AI 是否是最好的解法——AI 可以是外掛，而不必然是核心。

Apple：生成 UI 主觀性過高，不穩定即不可信

Apple 內部研究顯示：針對同一組 UI 優劣的評估，設計師之間的一致性只有 49.2%，略優於隨機猜測。這意味著「生成出好 UI」本身就無法被穩定驗證。Apple 的立場代表大型平台型公司傾向以確定性介面保護使用者的一貫體驗，而非追逐生成動態化。當行業廣泛討論「設計師轉型為意圖架構師」時，連如何判斷一個 AI 生成的介面好不好都沒有客觀標準，這是一個還沒有 GPS 就要導航的困境。

MIT：代理 AI 製造了「同意真空」，現行 UX 設計範式根本無法處理

MIT Technology Review 指出了一個更根本的問題：傳統 UX 設計的同意機制是線性的——使用者明確觸發動作，系統回應。但代理 AI 會在使用者不在場時代為行動，傳統的 cookie 同意或授權流程完全無法涵蓋此類情境。這不只是設計細節問題，而是 UX 範式的根本缺口。主張「可信性是新指標」的一方必須承認：目前沒有成熟的設計工具組，可以驗證「使用者未在場時的信任」究竟被設計到位了沒有。

可信性還沒有標準量尺

業界廣泛認同信任是新的 UX 核心指標，但各方提出的衡量框架——可預測性、透明度、控制感、可靠性——都缺乏標準化測量工具。Stanford 報告顯示透明度指數在下滑，McKinsey 的負責任 AI 成熟度分數才從 2.0 升到 2.3，Gartner 用「專案存活率」間接衡量信任。

這暗示了一個我認為重要的侷限：「易用性→可信性」的轉移在研究層面還沒有成熟的量尺。「意圖預覽」等設計模式目前主要來自設計師的案例推薦，而非大規模 A/B test 的驗證結果。業界是在沒有 GPS 的情況下導航——這既是設計機會，也是方法論的警告。

門檻會快速降低，工具遲早會出現。但在那之前，每個聲稱在設計「可信 AI」的團隊，都應該先誠實問自己：我們衡量信任的方式，比 49.2% 的隨機猜測好多少？

我的判斷

AI 助理的問題不是不夠聰明，是不夠讓人放心。產品設計現在比的不是好不好用，是值不值得信。

這個轉變對設計師的要求是真實的：不再只是畫介面，而是要定義行為邊界、設計驗收機制、決定 AI 在什麼條件下可以自主行動。但這個轉變目前面臨一個結構性尷尬——可信性還沒有成熟的量尺，設計師自己評估 AI 生成介面的一致性只有 49.2%，信任基礎設施（隱私框架、同意機制）的法規清晰度也還不足。

我的建議是先回答三個問題，再動手設計：

你的產品裡，AI 是在解決使用者已知的問題，還是創造使用者還不知道自己需要的使用方式？這個答案決定 AI 是外掛還是核心。
使用者在 AI 採取行動之前，能不能看到意圖、選擇確認或拒絕？如果不能，這個產品還沒有做到基本的信任設計。
你有沒有定義「AI 不該做什麼」的邊界？沒有邊界，就沒有驗收機制，信任就只是口號。

資料來源：Stanford HAI 2026 AI Index Report；Gartner Enterprise AI Agents Predictions 2025-2027；McKinsey State of AI Trust in 2026；EY Studio；Nielsen Norman Group；Smashing Magazine；Apple Human Interface Guidelines；MIT Technology Review；Lydia Chuang（台灣 UX 從業者觀察）

【延伸閱讀】

黃仁勳的五層蛋糕是：是產業洞察，還是精緻的行銷工程？

五層蛋糕是什麼？我對「五層蛋糕」的出發點：不是要否定框架的洞察，而是要把利益衝突放進閱讀邏輯裡

Anthropic 租下 xAI 22 萬顆 GPU：算力荒下的商業交易

Anthropic 租下 xAI 22 萬顆 GPU，代表 AI 競爭從模型走向算力與電力。真正關鍵，是這些資源能否轉化成更好用的 Claude 體驗