怎麼評估 AI 專案的 ROI 才不會低估？

別只看同一件事做得更快省了多少工時，要看頻率質變——當分析從一年一次變一月一次，能提早發現機會與風險，價值是跳級的。ROI 應對到競爭本質而非中階 KPI。

AI 的價值和風險可以分開管嗎？

很難。當 AI 夠重要，價值與風險是一體兩面。務實治理是讓法遵、風險、業務在同一個平台看同樣的問題與機會，達成共識才放行。

什麼是主權 AI？

指企業掌握 AI 在哪裡開發運算、資料由誰存取、會不會被拿去訓練的主導權。對重視資料的產業，公司機密不丟公開 AI 訓練是底線。

導入企業 AI 最該先想清楚什麼？

不是先選模型，而是先想清楚資料主權與治理，以及這個 AI 要對到的競爭本質。技術反而是相對後面的問題。

AI 怎麼用在設備維護上？

用深度學習模型加上領域專家特徵工程，把老師傅經驗變成智慧健康指標，在設備出問題前抓到初期徵兆，做動態預知維護，而非照固定保養規範。

為什麼說工廠不是實驗場？

工廠每天都在生產，不能反覆試錯。改用數位孿生，把生產設計、AI 驗證、流程優化先在虛擬世界跑完再上實體，可大幅降低風險與時間。

AI 會取代客戶經理或第一線人員嗎？

方向是補覆蓋率而非取代：AI Agent 常駐客戶端、處理人力做不到的即時與規模，人則回到判斷、經驗與關係經營的價值上。

導入 AI Agent 一開始就會很有效率嗎？

不會。實務是先苦後快，第一個最辛苦，隨 know-how 累積後面越做越快。建議先做一個最關鍵的 MVP。

monday.com AI Work Platform 是什麼?

monday.com 在 2026-05-06 宣布從 Work Management Platform 轉型為 AI Work Platform,核心訴求是「人 + AI Agent 一起把事情做完」。它包含 Sidekick、Agents、Vibe、Notetaker 四大 AI 產品線,Agent 在這個平台是 first-class citizen,可以被 @mention、指派為 owner、有長期記憶。

monday.com 的 AI 點數怎麼算?

所有 AI 產品共用單一單位「AI 點數」,1 點 = $0.01 USD。各產品消耗速率:Agents 任務 10–250 點、Notetaker 每小時 120 點、Vibe 應用 ~30 點、Workflows AI 執行 8 點、Sidekick 暫時免費。Vibe Prompt 還按模型分級:Gemini Flash 10–20 點、Claude Sonnet 30–50 點、Claude Opus 50–500 點。

Casetify 用 monday.com AI 達成什麼成果?

CASETiFY 用 5 個 Agent(Annie、AI 銷售管家、Eric、小蕾、AI 客服代表)跑完整 4 階段業務 lifecycle,專案準時交付率 85%、Scope creep 下降 20%、ROI 5 倍、PM 被追問 ticket 下降約 30%、內部溝通成本下降 20–30%。一年處理 600–700 個內部請求,300+ 使用者,100+ 國家營運。

monday Guardian add-on 提供什麼功能?

Guardian 是 Enterprise 專屬的安全 add-on,提供四大功能:Tenant-Level Encryption(TLE,帳號級加密金鑰)、Bring Your Own Key(BYOK,自帶金鑰)、Data Leak Prevention(DLP,資料外洩防護)、Multiple SSO(多重身分驗證)。BYOK 讓客戶可以撤銷金鑰存取,等同把 monday 鎖在門外。

monday.com 支援哪些 LLM 模型?

monday 支援 Anthropic Claude、OpenAI GPT、Google Gemini 三大模型,可以一鍵整合 ChatGPT、Microsoft 365 Copilot。Sidekick 內建會為不同任務自動挑模型。Enterprise admin 可在 AI Permissions Governance 後台控制誰能用哪個模型、在哪個 workspace 用、用什麼 agent,粒度可細到單一 agent。

什麼樣的企業適合導入 monday.com AI Work Platform?

5 種典型適配情境:(1) 大量標準化請求,一年幾百筆以上 (2) 跨部門 silo 嚴重,流程飄在 email/Slack (3) 業務 lifecycle 清楚分階段 (4) 重複性高的 knowledge work 占工時 30%+ (5) 跨國跨語言團隊。產業上 D2C 電商、SaaS、行銷代理強適配;金融核心、醫療臨床、傳產零售第一線弱適配(monday 只有 cloud-only,沒有私有部署選項)。

什麼情境不該導入 monday.com?

6 個紅旗訊號:(1) 流程根本沒標準化,垃圾進垃圾出 (2) 團隊 <10 人,Basic 點數太少、Enterprise 強制 25 席門檻 (3) 高度監管需要私有部署 (4) 沒結構化資料基礎、還在用 Excel (5) 一次性專案不重複 (6) 只算 seat 沒算 AI 點數的 TCO。25 席是 Enterprise 強制門檻,10-25 人公司想要 BYOK 或多重 SSO 經常踩雷。

50 人公司導入 monday.com 第一年要花多少?

以 50 人 Pro plan 估算:Pro 月費 × 50 席 × 12 月約 $15,000–18,000、AI 點數月跑 50,000 點約 $6,000/年、Notetaker 50 人月 4hr 會議約 $2,880(內含 AI 點數)、變更管理培訓 $5,000–20,000 一次性。第一年總計約 $26,000–44,000 USD。對應 CASETiFY 報的 5x ROI 約等於省 $130,000–220,000/年,回本期 6–12 個月。前提是真的把流程改了,不是買來放著。

Claude Code 訂閱 6/15 拆分對一般使用者影響大嗎?

對「個人從終端機 / IDE 互動式使用 Claude Code,搭配 Agent tool 派 subagent」這類典型使用者,影響趨近於零。互動池維持訂閱補貼價不變。只有四類具體模式會被搬到 SDK Credit Pool:claude -p 無頭命令、Claude Agent SDK、Claude Code GitHub Actions、第三方包裝(OpenClaw / Conductor / Zed / Jean)。

SDK Credit Pool 額度是多少?用完會怎樣?

Pro $20、Max 5x $100、Max 20x $200、Team Standard $20/seat、Team Premium $100/seat,按 API 全價算,額度不滾存每月歸零。用完後可選 enable overage(繼續按 API 全價收費,可能讓訂閱費 + 超支費比直接買 API 還貴)或 disable overage(請求被 reject 直到下個月)。

2026 中本地能跑什麼模型取代 Claude?

Qwen 3.6-27B(Q4 14GB,agentic coding 接近半年前 400B 水準)、Qwen 3.6-35B-A3B(MoE,Q4 18GB,快)、DeepSeek V4-Flash(284B MoE / 13B 啟動,重度量化 33GB VRAM 可跑,1M context)、Llama 3.3 70B(Q4 35GB,ecosystem 最大,異質 diversity 用)。100GB+ RAM 機器可同時 load 多 model 做真實的異質 Agent Team。

為什麼 30 天法律化時程不切實際,要改 90-120 天?

外部會計師 review 點出:工作規則修訂報主管機關核備需 14-30 天、工會協商勞基法 § 70 細則 30 天起跳、董事會通常季度開會。真實時程 90-120 天。Day 1-30 期間若違規發生洩密,法院可能不採信公司主張的「合理保密措施」(營業秘密法 § 2)。需加「過渡期免責條款」:Day 1-90 違規立合規導向處理,不得作為解雇依據。

為什麼預算要寫具體 NTD 4000-6000 萬,不能寫「中等到中高」?

CFO 視角:級距「中等到中高」完全不能拿給審計委員會。萬人集團一個 AI 治理案合理級距 Year 1 全包 NTD 4000-6000 萬:CapEx GPU 3-5x H100 約 1200-2000 萬 + 4090 多台 200 萬;OpEx 雲端 LLM Enterprise 1500-3000 萬 + ISO 稽核 200 萬 + RD x2 + Curator 600 萬 + SIEM 自架 100-150 萬 + 培訓教材 60-100 萬。產創條例 §10-1 智慧機械投抵可抵減營所稅 5%。

為什麼三道防線那麼重要?家族成員掛名 sponsor 不行嗎?

外部會計師 review:即使家族「掛名 sponsor」,Big-4 仍可能列「tone-at-the-top deficiency」— 過去案例某半導體上市公司家族「列席不表決」,KPMG 仍開 control deficiency,因會議紀錄顯示 Working Group 改提案以迎合家族口頭意見。SOX 控制環境看 substance over form。所以加 Steering Committee 議事規則明文「不得對 Working Group 個案決議下指導」+ 會議錄音是必要補丁。

為什麼第四輪 HR / CFO / 會計師 review 才找出 9 個關鍵 gap?

前 3 輪 7 個 domain expert(CISO / AI 治理 / ERP / 法務 / IT / 組織 / BU)是技術 + 治理視角。HR 看的是員工教育、認證制度、PBC 加分、工會、退休錄影同意;CFO 看的是 NTD 級距、CapEx vs OpEx、產創條例稅務、ROI、預算排擠;外部會計師看的是 SOX 控制環境、ITGC 證據鏈、監督委員會獨立性閉環、SOC 2 Type 2 證據時程。這三個視角是「前 7 個 domain 沒看到的」,只有獨立 review 才會被發現。

鄉村包圍要 BU 自願,但實務上沒人會自願?

對。台灣製造業 BU 主管思維「先看別人做、別人成功我再上、別人失敗我沒事」,M1-M3 預期不會有 BU 自願。所以鄉村包圍是「擴散階段」自願,「起爆階段」必須欽點:CIO 指定 1 個營收前三主力 BU,配套政治保險:CIO 公開承諾「示範期 KPI 不列入 BU 排名」+ BU 主管 PBC 加權 5%(年度)+ 失敗時 CIO 公開承擔策略失敗,不向下究責。

腦子系統合不合 ISO 27001 + ISO 42001?

大部分天然合,但有 5 個 gap 需要補強:A.5.7 威脅情報、A.5.30 業務持續性、A.8.28 secure coding(LLM 產 HTML)、ISO 42001 偏見緩解、AI 事故管理 SOP。具體做法:訂閱 OWASP Top 10 for LLM、Gateway HA + 本地 Ollama backup、HTML scanner、定期 bias baseline test、incident playbook 演練。已 27001 認證可快 30-40% 取得 42001。

鄉村包圍策略怎麼穩定踏實做完?

5 個 Phase Gate(每個過渡前要過硬條件):G0 啟動(CIO 簽 Iron Rules + 任命準 CISO)、G1 種子(2 BU 各 5 人在用)、G2 根據地(雙 Repo + 分級表 v0.1)、G3 包圍(集團 CLAUDE.md v1)、G4 進城(Gateway + 北極星 70%)、G5 稽核就緒(內審完成)。沒過 Gate 不要硬上下一階段,每個 Gate 對應 ISO 稽核里程碑。

多場景多用戶多工具怎麼用一套框架統一?

5 個共用元件:LLM Gateway(全公司共用)、分級對應表(Working Group 維護)、Audit Log(中央 SIEM)、Curator 制度(每 BU 一名)、KPI Dashboard(中央 RD)。5 種角色 × 4 類工具的矩陣:RD 主用 Coding Agent + Bridge,銷售/客服/採購主用 Chat-native + Self-service HTML,管理層主用 Self-service HTML 儀表板。不同角色不同工具,但全部走同一個 Gateway。

怎麼確保多方都得到正確、安全、合規、整合的資料?

四個機制:正確 — 資料來自 ERP via MCP/Gateway,LLM 不產生資料只整理渲染。安全 — 三層縱深(SSO + Gateway 規則 + iDempiere AD_Role)。合規 — 每個元件對應 ISO 控制項,稽核證據自動 export。整合 — Single Source of Truth,不同部門看到一致資料(都來自同一 ERP)、不同 AI 工具回應背後是同一 Gateway。

ISO 稽核準備要花多久?

傳統公司 1-2 個月補資料、做文件、開會。腦子系統設計讓 90% 證據自動產出:政策 git log、執行紀錄 Gateway audit log、脫敏實證 pipeline log、變更管理 PR 紀錄、KPI Dashboard、Curator review、訓練紀錄、合約 DPA。RD 投入時間降到 1-2 週,重點變成『整理+解釋』而不是『補資料』。

OpenClaw 為什麼被 Anthropic 封鎖?企業要怎麼避免?

2026/4/4 Anthropic 撤銷第三方工具的 OAuth 存取,Claude Pro/Max 訂閱不再支援 OpenClaw 等工具。原因:Claude.ai 訂閱是個人用,違反 ToS 不可 power programmatic workflows;OpenClaw 用 OAuth 把訂閱費當 API 用,Anthropic 形同補貼。企業教訓:永遠用 API key + Enterprise 合約,不要把員工個人訂閱當公司基建。本地模型(Qwen3-Coder-Next + Ollama)+ 開源 chat-native agent(QwenPaw)是唯一不被切的路徑。

OpenClaw 跟 OpenCode 是同一類東西嗎?

完全不一樣。OpenClaw 是 chat-native general-purpose AI agent,跑在本機,原生支援 WhatsApp/Telegram/Slack/Signal/iMessage 等多個 chat app,做 email/行事曆/訂機票/表單填寫等廣義自動化,給全公司員工(含非 RD)用。OpenCode 是 AI coding agent,跑在 terminal/IDE,做寫 code/debug/refactor,給開發者用。OpenClaw 跟 ccbot 是「同層」(行動端介面),不是跟 OpenCode 同層(coding agent)。

對企業 air-gapped BU 最理想的 OpenClaw 替代品是什麼?

QwenPaw (agentscope-ai/QwenPaw)。特色:本地模型優先(Qwen3-Coder-Next、Qwen3.6 等)+ 多 chat app 介面(DingTalk/Feishu/WeChat/Discord/Telegram)。對台灣企業特別合適 — 中文 chat app 支援度最高。其他選項:Nanobot(輕量 4000 行)、PraisonAI(low-code multi-agent)、Hermes Agent(self-improving)、Enclave AI(iPhone/Mac 完全本地)、OpenJarvis(Ollama/vLLM 整合)。

Chat-native Agent 跟 Coding Agent + Bridge 有什麼差別?

後者(如 Claude Code + ccbot)只給 RD 用,只做 coding 任務的行動延伸。前者(如 QwenPaw / OpenClaw)自帶 agent + 自帶多 chat app,做廣義自動化(email/行事曆/訂機票/行政),覆蓋全公司員工含 80% 不寫 code 的人。對萬人集團來說 chat-native 路徑覆蓋面大得多 — 業務、客服、行政、HR 不需要 coding agent,他們要的是 chat app 內直接呼叫的助手。

OpenClaw 事件給企業的最重要教訓是什麼?

四個教訓:(1)永遠用 API key 不要用個人訂閱 OAuth,員工說「用我的 Claude Pro 接公司工具」聽起來省錢,實際上隨時被切;(2)「廠商封鎖風險」要納入工具選型,不要把全公司流量壓在單一廠商;(3)本地模型 + 開源 chat-native agent 是唯一不被綁的路徑(QwenPaw + Ollama + Qwen3-Coder-Next 完全自主);(4)Enterprise 合約 negotiate 時把「policy stability,廠商如改政策提前 90 天通知」寫進去。

標籤: 企業 AI

當 AI 夠重要，價值與風險就是一體兩面：談 AI 治理與 ROI
重點摘要
- AI 的 ROI「難算又好算」：別只看表面省工，要看頻率質變——一個分析從「一年做一次」變成「一月一次」，價值是跳級的。
- ROI 要對到競爭本質與戰略目標，不是中階的過程 KPI。
- 當 AI 夠重要，它的價值與風險就是一體兩面，這不是缺陷，是事實。
- 治理心法：讓法遵、風險、業務所有人在同一個平台看同樣的問題與機會，達成共識才放行。
- 底線是主權 AI：公司的資料不能丟到公開 AI 去訓練。
這是 SAP NOW AI Tour 系列的最後一篇。前面談了方法論、技術、案例，這篇談一個比技術更難、卻真正決定成敗的東西——AI 治理與 ROI。這天聽下來，最深刻的幾段都不是在講模型多強，而是在講「怎麼算它的價值」和「怎麼管它的風險」。

一、ROI 難算又好算：關鍵在「頻率質變」

一位銀行高管分享的 ROI 觀點，我覺得每個要替 AI 專案爭預算的人都該聽。他說 AI 的 ROI「難算，但也好算」。

難算，是因為一個企業要用 AI 做什麼，沒辦法被量化反推；好算，是因為當 AI 對到「三到五年後的巨大競爭優勢」時，那些成本相對就不是重點。他舉了一個企業信用分析的例子，非常經典：

一開始算 ROI，是「原本一個人要做 36 小時，AI 降到 3 小時」。聽起來省了工，但因為做的人不多，效益看起來普通。後來他們發現算錯了重點——因為過去要花 36 小時，這個分析一年只能做一次；但 AI 只要 3 小時，就能改成一季一次、甚至一個月一次。頻率一變，質就變了：能提早發現客戶信用變好（多給額度）、或提早發現問題（不用等到明年，中間就預警）。他說：「這對銀行是很大的突破，效益沒辦法估量，因為太大了。」

這就是頻率質變：真正大的效益，往往不在「同一件事做得更快」，而在「快到可以改變做這件事的頻率」。表面的工時 ROI，會嚴重低估它。

二、ROI 要對到戰略本質，不是中階 KPI

承上，他的結論是：AI 專案的 ROI，應該對到「你原本要創造的競爭優勢是什麼」，而不是中階的過程指標。製造業的講者也呼應這點——挑 AI 專案的優先順序，是「越能直接反映客戶需求的越優先」（良率、產出、交期），而不是從內部好做的地方開始。

另一個容易被低估的效益是潛在損失的避免。一家電子大廠提到，AI 最大的價值往往不是看得到的降本，而是「在第一關就攔截一個品質議題，避免整批損失」——這種效益很難寫進試算表，卻可能是最大的。還有橫向複製：一個廠導入成功，就能複製到二十個廠，效益會放大到難以估算。

三、價值與風險，是一體兩面

講到治理，那位銀行高管用了兩個會場引用的軍事 AI 案例，把問題講得很透。同一套 AI 影像辨識系統：
- 故事一：在任務中辨識出前方的威脅，救了一條人命。
- 故事二：把一個人手上拿的東西誤判成危險物，造成了無法挽回的誤傷。
同一個系統，兩個極端。只看故事二，你會想「隔天就把系統關掉」；只看故事一，你會繼續用。他的洞察是：當你的 AI 夠重要，它一定同時帶著高價值與高風險——這是一體兩面，不是哪邊做得不夠好。

四、治理心法：所有人在同一個平台達共識

既然價值與風險綁在一起，怎麼管？他的答案很簡單，也很難：讓所有人在同一個平台上。

以他們銀行為例，法遵、風險、業務人員，都在同樣的平台、看同樣的 AI、同樣的問題與機會。沒有共識，就沒辦法離開那個辦公室——因為一定有人覺得「該關掉」，有人覺得「不能關（關掉會出事）」，必須當場喬到共識。這比任何一份治理文件都實在：把對的人放在同一個畫面前，逼出共識。這也呼應全場另一個反覆出現的觀點——AI 治理的重點，是讓 AI「行為有序」地在企業內運行，而不是放任它亂竄。

五、底線：主權 AI

如果說全場有一條最強的暗線，那就是主權 AI（Sovereign AI）——這個詞在不同講者口中至少出現了三次。顧問業引用的調查顯示，超過七成的企業領導者認為「AI 在哪裡開發／運算」是選技術的關鍵考量；製造業強調總部集中算力、守住數位主權；而傳產的設備主管講得最白：

每個公司都有自己的機密，你不會希望把自己的資料丟到公開的 AI 上去訓練。所以你需要的是主權 AI。

對製造業、金融業這種高度重視資料的產業，這會是董事會問的第一個問題。所以在選型時，「資料留在哪、誰能存取、會不會被拿去訓練」往往比「模型多聰明」更早被決定。

結語：難的不是技術，是人與治理

四篇寫到這裡，剛好繞回系列第一篇的結論：數位轉型 80% 卡在組織與人，不是技術。AI 治理也是同一回事——真正難的，不是把模型接起來，而是怎麼算清楚它的價值、管得住它的風險、讓所有人對它有共識。

把整個系列濃縮成一句話：AI 降低了工具的門檻，卻抬高了「懂業務、會判斷、守得住治理」的人的價值。工具會越來越好用，但會用工具的人和組織，才是差距所在。

常見問題 FAQ

怎麼評估 AI 專案的 ROI 才不會低估？

別只看「同一件事做得更快」省了多少工時，要看「頻率質變」——當一個分析從一年一次變成一月一次，能提早發現機會與風險，價值是跳級的。ROI 應對到競爭本質，而非中階過程 KPI。

AI 的價值和風險可以分開管嗎？

很難。當 AI 夠重要，價值與風險是一體兩面。務實的治理是讓法遵、風險、業務在同一個平台看同樣的問題與機會，達成共識才放行。

什麼是主權 AI（Sovereign AI）？

指企業掌握「AI 在哪裡開發、運算，資料由誰存取、會不會被拿去訓練」的主導權。對重視資料的產業，公司機密不丟公開 AI 訓練是底線。

導入企業 AI，最該先想清楚什麼？

不是先選模型，而是先想清楚資料主權與治理（資料留在哪、誰能存取），以及這個 AI 要對到的競爭本質。技術反而是相對後面的問題。
📚 本系列：SAP NOW AI Tour 的 4 堂課
- ① 方法論：數位轉型為什麼失敗
- ② 技術骨架：MCP 與 A2A
- ③ 真實案例：三個落地場景
- ④ 治理與 ROI（本篇）
2026 年 6 月 9 日
傳產與金融怎麼把 AI 落地？三個真實場景
重點摘要
- 鋼鐵廠：讓機器狗進約 1,200°C 的高爐巡檢，並用「設備健康指標像人的健康指標」的概念，做動態預知維護。
- 銀行：把客戶經理變成 AI Agent，靠「下游的下游有訂單」的線索，搶在同業之前打那通電話。
- 電子代工：信奉「工廠不是實驗場」，所有試錯與優化先在數位孿生裡跑完，再上實體。
- 三個產業差很遠，但共通點一致：AI 不是取代人，而是把人從危險、重複、來不及反應的地方解放出來。
這是 SAP NOW AI Tour 系列的第三篇。前兩篇談方法論與技術骨架，這篇講最好看的部分——真實案例。我挑了三個差異很大的產業（鋼鐵、銀行、電子代工），看他們各自怎麼把 AI 落到地上。為尊重分享者，以下用產業代稱、只引用公開分享的內容。

一、鋼鐵廠：讓機器狗進 1,200 度的高爐

鋼鐵是典型的「3K 場域」——危險、骯髒、辛苦，再加上傳產普遍的缺工壓力。這家鋼鐵龍頭的設備部門，把 AI 用在兩個地方，我覺得都很有啟發。

無人化：機器狗、無人機、無人天車

高爐的高點，溫度約 1,200°C，爐板一旦出問題可能導致熱點甚至爆炸——這種地方不適合人進去。他們的解法是把巡檢路徑寫成程式，讓機器狗去走、去看，背後的資料庫做預知分析。有人問「機器狗為什麼要練爬樓梯？」講者的回答很妙：人也不是天生會走路，是學會之後才會；機器人往前走要耗大量運算在做平衡，如果目的是去收集數據，那就讓它走遍各種路去練。同樣的思路也用在無人天車上——AI 控制吊掛鋼捲時，左右自動防擺，比人操作還穩。

設備健康指標，就像人的健康指標

這是我整天聽到最好的一個比喻。買設備時，廠商會告訴你「多久保養一次」，那是固定規範。但設備用久了會慢慢變化，固定規範不一定適用。講者拿人來類比：

小孩子量身高、體重、頭圍最重要；到了中老年，身高體重沒太大意義，要量三高。設備也一樣——剛買的設備和用了十年的設備，同一個指標代表的意義完全不同，不能用同一套標準看。

所以他們用 AI（深度學習模型 + 領域專家的特徵工程）把老師傅的經驗變成「智慧健康指標」，在設備出問題前就抓到初期徵兆。核心一句話：用「數據驅動」取代「直覺或規範」。

二、銀行：把客戶經理變成 AI Agent

一家大型銀行的企業金融部門問了自己一個尖銳的問題：我們的服務方式會不會被取代？他們的答案是「會」，所以乾脆自己先動手。

最精彩的是一個「搶先機」的案例。某個企業客戶可能接到一筆訂單——這種公開資訊大家都看得到。但這家銀行的客戶經理，會在早上收到系統提示：「你可能要去拜訪某客戶。」怎麼知道的？因為系統掌握到這個客戶「下游的下游」可能有訂單，照這個模式推斷它有機會接單，再比對它最近的新聞表現。因為它會接單，就可能有備料與資金需求——於是客戶經理提前打了那通電話。結果是：客戶的財務長第一個接到的，是這家銀行打來的。

更進一步，他們的想像是把客戶經理本身變成一個常駐客戶端的 AI Agent。一個真人沒辦法一天到晚守在客戶那裡待命，但 AI 可以。背後的技術，就是用前一篇談過的協定，把銀行服務嵌進客戶的 ERP 流程裡。這呼應了一個全場反覆出現的觀點：AI 不是要取代你，而是讓你把「人做不到的覆蓋率」補起來。

三、電子代工：工廠不是實驗場

一家全球佈廠的電子代工大廠，分享了他們十多年的 AI 進化。最打動我的，是一句很樸素的話：「工廠是每天在生產運行的地方，並不是給你做實驗的地方。」

所以他們的核心策略是數位孿生：所有的生產設計、AI Agent 的驗證、流程的優化，都先在虛擬世界裡跑完，再上實體。一個模擬若用實體去做實驗可能要兩個月，在數位孿生裡快很多；而且實體還沒蓋，就能先把問題找出來、把良率拉上去。他們也坦白分享了 Agent 的導入節奏：今年初做了第一個 Agent，到年中大概第八個——剛開始導入比較辛苦，但越往後越快，因為 know-how 會累積。這跟前面銀行、鋼鐵的經驗一致：先做最關鍵的那一個，驗證了再放心擴展。

結語：三個產業，同一個底層邏輯

把這三個案例疊在一起，會發現它們其實在講同一件事：
- 方向一致：都是把人從危險（高爐）、重複（守客戶）、來不及反應（品質與訂單）的地方解放出來。
- 節奏一致：都先做一個最關鍵的 MVP，驗證了再擴展，沒有人一次性全導入。
- 對人的定位一致：AI 接手「人做不到或不該做」的部分，人回到判斷與經驗的價值上。
下一篇是系列最後一篇，談一個比技術更難、卻決定成敗的東西——AI 治理與 ROI：當 AI 夠重要，它的價值與風險就是一體兩面，你該怎麼算、怎麼管？

常見問題 FAQ

AI 怎麼用在設備維護上？

用深度學習模型加上領域專家的特徵工程，把老師傅的經驗變成「智慧健康指標」，在設備出問題前抓到初期徵兆，做動態的預知維護，而不是照固定的保養規範。

為什麼說「工廠不是實驗場」？

因為工廠每天都在生產，不能拿來反覆試錯。改用數位孿生，把生產設計、AI 驗證、流程優化先在虛擬世界跑完再上實體，可大幅降低風險與時間。

AI 會取代客戶經理或第一線人員嗎？

案例顯示的方向是「補覆蓋率」而非取代：AI Agent 常駐客戶端、處理人力做不到的即時與規模，人則回到判斷、經驗與關係經營的價值上。

導入 AI Agent 一開始就會很有效率嗎？

不會。實務經驗是「先苦後快」——第一個最辛苦，隨著 know-how 累積，後面越做越快、效益越來越可觀。建議先做一個最關鍵的 MVP。
📚 本系列：SAP NOW AI Tour 的 4 堂課
- ① 方法論：數位轉型為什麼失敗
- ② 技術骨架：MCP 與 A2A
- ③ 真實案例：三個落地場景（本篇）
- ④ 治理與 ROI
2026 年 6 月 9 日

AI Agent 怎麼接進企業系統？看懂 MCP 與 A2A 兩個關鍵協定

重點摘要

AI 應用正從「單一模型／聊天機器人」走向 Agentic AI（自主規劃、推理、跨系統行動）。
Agentic AI 有兩個關鍵挑戰：Agent 怎麼連接工具？怎麼跟其他 Agent 合作？由此誕生兩個開放協定。
MCP（Model Context Protocol）= 垂直整合：讓單一 Agent 往下接工具與資料源。
A2A（Agent-to-Agent）= 水平協作：讓多個 Agent 之間互相委派任務。
資料層上，趨勢是「串接而非搬遷」——地端資料可以留在原地，用連接器接上雲端分析。

這是 SAP NOW AI Tour 系列的第二篇。第一篇談方法論（為什麼轉型會失敗），這篇換上工程師的眼睛，談技術骨架：當大家都在喊 Agentic AI，到底 AI Agent 是怎麼接進一家企業既有的系統？這一整天聽下來，金融、製造、雲端三方不約而同指向同兩個字母組合——MCP 與 A2A。

一、先看演進：從 Traditional AI 到 Agentic AI

AI 在企業裡的應用方式，大致經過三個階段：

Traditional AI：單一模型、單一任務（聊天機器人、文件摘要）。
AI chatBot：AI 嵌入應用，輔助人員完成工作。
Agentic AI：AI 自主規劃、推理、行動，並跨系統協作。

到了第三階段，問題就來了：一個 Agent 要做事，得能呼叫工具、讀寫資料；而真實的企業流程往往要好幾個 Agent 接力。於是兩個關鍵挑戰浮現——Agent 如何連接工具？如何與其他 Agent 合作？

二、兩個開放協定：MCP 與 A2A

這兩個挑戰，分別由兩個開放協定來解。它們不是競爭關係，而是互補——一個管「垂直」，一個管「水平」。

維度	MCP（Model Context Protocol）	A2A（Agent-to-Agent）
連接對象	Agent ↔ 工具／資料源	Agent ↔ Agent（雙向協作）
整合方向	垂直整合（取用工具）	水平協作（分工委派）
典型用法	Agent 透過 MCP 存取 ERP 資料庫 / API	一個 Agent 透過 A2A 把任務委派給另一個 Agent

一句話記憶：MCP 讓 Agent 往下接系統，A2A 讓 Agent 之間互相傳接棒。

三、實際跨系統流程長怎樣

會場舉了一個很好懂的端到端流程，看完就知道兩個協定是交替使用的：

採購 Agent 用 MCP 查庫存
→ 物流 Agent 用 A2A 被委派去安排出貨
→ 財務 Agent 用 MCP 更新帳務
→ 完成一條自動化流程

每個 Agent 用 MCP 往下接自己負責的系統，再用 A2A 把棒子交給下一個 Agent。這就是 Agentic AI「跨系統協作」的具體長相。

四、資料層：串接，而不是搬遷

講到 Agent 接資料，現場有個觀眾問了一個很實際的問題：「用 AI 是不是一定要把所有資料都搬上雲？」畢竟資安、上雲成本、地端的第三方系統，都是真實顧慮。

答案是「不用」。現在的資料雲走的是「串接」而不是「搬遷」——透過連接器（Data Provisioning Agent 這類機制）直接接上地端資料，資料可以留在原地，上層再用 AI 做分析與呈現。對於有資安顧慮、又想用 AI 的企業，這條路很關鍵。一個實際的搭法是：既有系統（ERP／設備系統）→ 連接器 → 雲端的資料模型層（如 Datasphere）+ 報表層（如 SAP Analytics Cloud），最前面再接一層自然語言（Joule），就能「用一句話問、自動跑出分析圖表」。

五、官方參考架構：把內外 Agent 安全地串起來

最後一張技術總圖，把上面這些拼成了一個完整的互通架構（這是雲端與 ERP 兩大廠的聯合參考架構）：

企業內部的 Agent（Orchestrator + 各種 Custom／Low-Code／Pro-Code Agent）透過 A2A 跟外部雲端的 Agent 協作；
透過 MCP 接到 ERP、資料雲等既有系統；
身份與信任由統一的 Identity Service 治理（authenticate / trust）。

值得一提的是，雲端廠在大會上一口氣發布了多項與 ERP 深化整合的東西，包括官方的 MCP Server（讓 AI Agent 透過整合套件安全存取 ERP 商業數據）、支援 ABAP 開發者的 AI IDE，以及基於雲端模型平台的 Agentic AI 方案。換句話說，MCP 已經不是概念，而是有官方實作可以開始試的東西。

結語：協定先行，骨架才穩

如果你也在規劃企業內的 AI Agent，這篇的重點只有一個：先把「Agent 怎麼接系統、怎麼互相協作」這層協定想清楚，再談上面要跑什麼應用。MCP 負責垂直、A2A 負責水平，資料層走串接不搬遷，身份治理統一——這就是下一代企業 AI 自動化的骨架。下一篇換個角度，看真實的傳產與金融公司，是怎麼把這套東西落到地上的。

常見問題 FAQ

MCP 和 A2A 有什麼差別？

MCP 是讓單一 Agent 垂直連接工具與資料源（例如存取 ERP 資料庫）；A2A 是讓多個 Agent 之間水平協作、互相委派任務。實際流程裡兩者交替使用。

用 AI Agent 一定要把資料搬上雲嗎？

不一定。可以用連接器「串接」地端資料，讓資料留在原地，再由雲端的分析層處理，兼顧資安與成本。

什麼是 Agentic AI？

相對於單一任務的傳統 AI 與輔助型的 chatBot，Agentic AI 能自主規劃、推理、行動，並跨多個系統協作完成任務。

MCP 現在可以實際使用了嗎？

可以。雲端與 ERP 大廠已推出官方的 MCP Server，讓 AI Agent 透過整合套件安全存取 ERP 商業數據，並有支援開發者的相關工具。

📚 本系列：SAP NOW AI Tour 的 4 堂課

2026 年 6 月 9 日

數位轉型不是換系統：企業 AI 落地為什麼失敗，又該怎麼做對

重點摘要

麥肯錫研究指出:數位轉型失敗的主因 80% 在「組織與人」，而不是技術。
AI 世代的轉型有四大關鍵核心：人員、流程、應用、數據，四者要同步處理，不能只做一個。
轉型有不能跳過的順序：合理化 → 標準化 → 自動化。跳過前段直接自動化，等於把錯的流程加速。
很多企業的「戰情室／儀表板」做完沒人用，是因為它只看落後指標；當員工覺得「自己下載資料用 Excel 更快」，系統就開始死亡。
一句話：數位轉型只是手段，真正的目的是創造價值。

我參加了一整天的企業 AI 大會，聽了金融、半導體、電子製造、鋼鐵、顧問與雲端平台共六、七家公司分享他們怎麼把 AI 落地。把這些不同產業的經驗放在一起聽，最有趣的發現是：他們講的「成功關鍵」高度一致，而且那個關鍵幾乎都不是技術。這篇是系列第一篇，先談方法論——企業 AI 為什麼會失敗，又該怎麼做對。

一、先承認：80% 的轉型卡在「人與流程」，不是技術

會場引用了一份麥肯錫研究：數位轉型失敗的主因在於「組織與人」，而非技術本身。成敗大約 80% 取決於「組織與人」的改變與「方法」的正確性，而「資料」與「內容」是實現價值的核心基石。

把它拆開來看，組織面的挑戰是：缺乏清晰的轉型願景、組織結構僵化、跨部門協作困難、決策流程緩慢、資源分散。人員面的挑戰是：員工抗拒改變、數位技能不足、人才流失、缺乏主人翁意識、溝通不足導致信任缺失。這些沒有一條是「買哪個 AI 工具」能解的。

現場有位經營者講得更直接：很多人怕因為跟不上而被淘汰，所以拒絕改變；而真正成功的企業，是想辦法讓「最懂業務的資深人員」被 AI 賦能，而不是被取代。AI 降低了工具門檻，卻抬高了「懂業務、會問對問題」的價值。

二、四大關鍵核心：人員、流程、應用、數據

在 AI 世代，數位轉型規劃有四個關鍵核心，每一個都帶著自己的痛點。整理成一張表最清楚：

核心	三大痛點
人員	技能隔閡、變革阻力、組織知識流失
流程	過時流程、跨系統依賴、合規問題
應用	過度客製、技術債、整合挑戰
數據	數據孤島、數據品質問題、數據安全與合規

關鍵在於這四個要同步處理。只把「數據」清乾淨、卻不動「流程」和「人員」，AI 一樣跑不起來；反過來也一樣。多家公司不約而同提到的共通痛點——數據孤島、技術債、缺乏單一真實來源——其實都落在這四個象限裡。

三、不能跳步：合理化 → 標準化 → 自動化

一位資深製造業高管分享了一個很樸素但很重要的原則：轉型沒有捷徑，過程必須照順序走——

先把做事情的順序合理化
再想辦法標準化
標準化之後，才能自動化（接著才是 AI）

為什麼順序這麼重要？因為如果你跳過合理化與標準化、直接自動化，你的標準很可能是錯的——這等於把一個錯的流程加速，是一場無效的轉型。這也呼應了現場另一個觀察：很多人誤以為「拿一個工具來、不需要前面那些步驟，就能把事情做好」，但這從來不會成立。

對應到角色，轉型會依序需要三種人：BA（業務分析）把現況忠實記錄成流程、SA（系統分析）定義這些需求該用什麼系統滿足、SD（系統設計／開發）實作。順序顛倒，後面全部白做。

四、為什麼「戰情室」做了沒人用

一家深耕 SAP 二十多年的整合商，分享了一個我覺得每個做過 BI 專案的人都會心一笑的觀察：傳統的策略支援系統（戰情室、儀表板）會沿著一條曲線慢慢失效。

階段	作用強度	狀態
過去	100%	決策利器，報表即時、深受信任
幾年前	75%	仍具價值，但開始延遲、需人解讀
現在	40%	內容固定、無法靈活、使用率下降
不久後	15%	「自己做更快」，轉向替代方案
未來	5%	報表停更、系統荒廢

真正的死亡轉折點，發生在「現在 → 不久後」之間：當員工覺得「我自己下載資料、用 Excel 加工更快」，這個系統就開始死亡。幾年後公司又起一個新專案、重做一個新的戰情室，如此不斷循環。

根因是什麼？傳統戰情室只給你落後指標——告訴你「過去發生了什麼」。但經營者真正面對的世界，不是內部報表，而是外部的快速變化。一句話點破：現在企業經營，最大的風險不在「做錯決策」，而是「太晚知道這世界變了」。所以下一代的決策平台，要從「內部、落後、檢討過去」轉向「外部、領先、預判未來」。

五、把方法論變成步驟：從經營分析到決策機制

那實際要怎麼建？現場分享的一套五步驟方法論，把上面這些抽象原則落成了可執行的流程：

經營分析：先對準企業目標——「企業到底需要什麼」，盤點現有流程與痛點。
資訊探索：從資料裡看清楚「現在發生了什麼問題、哪些資料必須收集進來」。
要因分析：用模型與統計方法，找出最重要的影響因子，把它變成你的領先指標。
建立決策引擎：做出預測模型與預警儀表板。
形成決策機制：導入流程、教育訓練、持續優化，確保它真的被用起來。

注意第三步「要因分析」才是重點——找出領先指標，而不是把舊的三十幾個 KPI 再畫一次。如果你做數位轉型時，還是只盯著以前那幾張報表看，那不會從根本改變公司的體質。

結語：轉型是手段，創造價值才是目的

麥肯錫、BCG、Gartner 對「數位轉型」的定義各不相同，但他們都強調同一件事：要創造價值。多數公司過於聚焦在前半段的「數位化」（導入工具、優化局部流程、提升效率），結果改善了效率、價值卻有限，難以帶動企業成長。真正的數位轉型，是重新設計商業模式與價值交付。

所以如果只能記一句話，我會記這句：數位轉型只是手段，真正的目的在於創造價值。工具會越來越好用，但真正的差距，落在你有沒有把流程、資料與人，重新組織成一個 AI 跑得動的樣子。

這是 SAP NOW AI Tour 系列的第一篇（方法論）。接下來幾篇會談技術骨架（MCP 與 A2A 怎麼讓 AI 接進企業系統）、真實落地案例（傳產與金融怎麼做），以及 AI 治理與 ROI。

常見問題 FAQ

數位轉型失敗的最主要原因是什麼？

根據麥肯錫研究，主因是「組織與人」而非技術，成敗約 80% 取決於組織與人的改變、以及方法的正確性，資料與內容則是實現價值的基石。

為什麼不能直接導入自動化或 AI？

因為順序是「合理化 → 標準化 → 自動化」。跳過前面直接自動化，等於把一個還沒理順的錯誤流程加速，是無效的轉型。

為什麼很多 BI 戰情室做完就沒人用？

因為它只提供「落後指標」、內容固定難以靈活。當員工覺得自己下載資料用 Excel 更快，使用率就會一路下滑到系統荒廢。解法是轉向外部感知與領先指標。

數位化和數位轉型有什麼不同？

數位化偏向導入工具、優化局部流程、提升效率；數位轉型則是重新設計商業模式與價值交付。前者改善效率但價值有限，後者才能驅動企業持續成長。

📚 本系列：SAP NOW AI Tour 的 4 堂課

① 方法論：數位轉型為什麼失敗（本篇）
② 技術骨架：MCP 與 A2A
③ 真實案例：三個落地場景
④ 治理與 ROI

2026 年 6 月 9 日

從自動化到自主化：SAP NOW AI Tour 座談五觀察

重點摘要

企業 AI 的競爭，正從「誰的工具快」轉向「誰能把 AI 行為有序地放進流程」——人機協作分成三階段：人在迴圈中、人在迴圈上、人當協調者。
餐飲業者提出務實的加薪邏輯：AI 提升 25% 效能，就把待遇提升 25%（5 人月薪 4 萬 → 4 人月薪 5 萬）。
製造業者的答案是「戰略集中化 + 應用邊緣化」：總部集中算力與資料治理，海外廠用「參數包」無痛複製。
顧問業者強調：真正難被複製的不是單一技術，而是跨產業整合能力；做的不是科技本身，而是改善流程。
平台商的結論：資料不必全部搬上雲（用串接而非搬遷），而成功的關鍵其實是一連串「選擇」。

這是一場以「企業 AI 如何落地」為題的綜合座談，與談者橫跨餐飲、光電製造、科技集團、顧問與平台商。把五個視角放在一起聽，會發現他們其實在講同一件事的不同切面：AI 正從「自動化」走向「自主化」。以下是我在現場記下的五個觀察。

一、AI 不是要取代你，而是放大你的價值

座談一開始就定調：多數與談者都同意，AI 帶來的不是「取代」，而是經營模式的變革。

餐飲集團董事長講得最直白：「餐飲業的本質不會改變，但 AI 會帶來經營模式的變革。」他認為這個產業「太幸運」——人與人之間有溫度的交流，本來就不會被 AI 取代，反而能被 AI 放大價值。他舉點餐為例：與其讓客人自己滑手機自助點餐，理想場景是 AI 一眼認出常客、知道他的口味偏好，讓不同的服務夥伴也能交付一樣的感動。

二、餐飲業的加薪邏輯：五成四變四成五

最讓我記住的一段，是餐飲董事長對「AI 與待遇」的算式。他向董事會、股東、同業溝通的概念叫「五成四變四成五」：

原本 5 個人、平均月薪 4 萬
透過 AI 與科技導入提升效能 → 變成 4 個人、每人平均月薪 5 萬
待遇提升 25%

他的主張是：如果 AI 能提升夥伴 25% 的效能，就應該把這 25% 回饋到待遇上。對一個長期缺工的產業來說，這不只是成本算式，更是留才與招募的吸引力。而要支撐這件事，背後需要可信賴、精準的底層資訊系統——當門市數量、來客人次累積成海量資料，沒有系統就無法把資料變成更好的經營決策。

三、製造業的跨國解法：集中化加邊緣化

光電製造業者面對的是另一種題目：跨國擴張時，如何把品質判斷複製到海外廠？他分享了一個很具體的痛點：光學元件最後常要靠老師傅「目視判斷品味」，這件事很「玄」，而當你要在海外設新廠時，沒有同一批老師傅怎麼辦？

他們的做法是把老師傅的判斷標準化——用 AI 影像模型即時記錄作業員檢視產品時的角度、停留時間，一旦方式不對就現場提醒。累積資料後做預測與比對，這套機制就能搬到海外廠，降低跨國擴張的品質風險。延伸到組織層級，他畫出一張「未來跨國 AI 頂層設計架構」：

層級	做法
戰略集中化	總部建置核心算力，集中治理乾淨的核心資料，對核心智慧財產分級安全管控，守護「數位主權」
應用邊緣化	海外各廠作為應用端，快速無痛導入由總部打包的微服務「參數包」，把前線操作門檻降到最低

他用了一句很到位的話收尾：「數據決定智商，治理引領戰略；人才點亮大腦，批判成就卓越。」並提醒：AI 賦能很好，但不能讓所有人各做各的，否則既浪費又有風險——就像飛機機長能在自動駕駛時休息，靠的是「對的系統」，而不是一直手動微調。

四、整合能力才是護城河

科技製造集團的代表談「大艦隊」如何協同。他的心法是：AI 不是拿著鎚子到處找釘子——不要看到哪裡就把工具往哪裡敲，而是先找出整個集團最重要的事，再用 AI。

他們的競爭力主張是：「真正難被複製的，不是單一技術，而是跨產業整合能力。」關鍵在於整合算力、網路、資料、場域與產業 know-how，讓 AI 從「分析工具」進一步成為「營運執行助力」。而支撐這種跨公司、跨事業群整合的，是一套「單一數據真相」。

顧問業者則把話題拉回本質：「我們要做的不是科技本身，而是怎麼去改善營運、改善業務、改善流程。」他強調關鍵始終在你的資料——先把碎片化的資料匯進系統、治理好，才談得上往上疊應用。對於代理型 AI（Agentic AI）的紅利，他的建議是：資源有限，必須有排序與藍圖，而且「未來是系統整合的世界」，懂業務結構的人，才找得出最適應自己的 AI 應用。

五、平台商的兩個答案：資料留地端、成功靠選擇

平台商在觀眾 Q&A 給了兩個很實用的答案。

問題一：用 AI 一定要把所有資料都搬上雲嗎？

答案是「不用」。透過資料雲的「串接」機制（而不是把資料整個搬上去），地端資料可以留在原地，上層再用 AI 助理做分析。對於有資安與成本考量、又想用 AI 的企業，這是關鍵的一條路。

問題二：員工要具備什麼技能、上什麼課才會用？

最大的差別是：過去要寫程式、做報表再串接，現在這些提示（prompt）已經內建在產品裡——會打字、會用講的，就能用，不太需要特別上課。換句話說，提示工程被產品吸收了，人的價值回到「會問對問題」加上業務判斷。

而對於「企業如何像自動駕駛一般運作」，平台商的結論很清楚：成功的關鍵在一連串的「選擇」——從哪裡開始、聚什麼團隊、選什麼平台、選哪些流程與資料、找哪些顧問參與。平台本身不是萬靈丹，選對標準流程，AI 才發揮得出來。

整場的理論收束：人機協作的三階段

如果要用一張圖總結這場座談，那會是平台商提出的「人類決策 + AI 執行」新運作邏輯。知識圖譜像一個「導遊」，告訴 AI 流程在哪、要取哪個系統、資料在哪；而人與 AI 的協作，會經歷三個階段：

階段	人的角色
人在迴圈中（Human-in-the-Loop）	人觸發並監控代理的每個動作
人在迴圈上（Human-on-the-Loop）	系統觸發代理，人只處理例外
人當協調者（Human-as-the-Orchestrator）	人退居監督者，跨多個 AI 助理協調指揮

人從「親自做」走向「監控」、再走向「處理例外」與「協調指揮」——這正是「從自動化到自主化」的具體階梯。而與談者最後那句話，也許是整場最好的註腳：

人機協作的時代已經來臨——機器不是要取代你，而是你要教會它，如何「行為有序」地在企業內部運行。

結語：差距落在組織，而不是工具

回看這五個視角，會發現它們其實在講同一件事的不同切面：方向一致——都指向「AI 從輔助走向自主」；底線一致——資料治理與「讓 AI 行為有序、不亂竄」是所有人的共同前提；對人的重新定位——AI 降低了工具門檻，卻抬高了「懂業務、會問對問題」的價值。

工具會越來越好用，但真正的差距，落在你有沒有把流程、資料與人，重新組織成一個 AI 跑得動的樣子。

常見問題 FAQ

企業導入 AI，一定要把資料全部上雲嗎？

不一定。可以用資料雲的「串接」機制讓地端資料留在原地，再由上層 AI 做分析，兼顧資安與成本。

員工要會寫程式才能用企業 AI 嗎？

多數情況不用。提示（prompt）已內建在產品裡，會用自然語言（打字或講話）就能操作；價值回到「會問對問題」與業務判斷。

「從自動化到自主化」具體是什麼意思？

指人機協作的演進：人在迴圈中（觸發監控）→ 人在迴圈上（只處理例外）→ 人當協調者（指揮多個 AI 助理）。

跨國企業怎麼把 AI 能力複製到海外廠？

一種做法是「戰略集中化 + 應用邊緣化」：總部集中算力與資料治理，海外廠用標準化的「參數包」快速導入。

2026 年 6 月 9 日

monday.com AI Work Platform 完整解析:4 大產品線、點數計費與 Casetify 實戰

重點摘要

2026-05-06 monday.com 從 Work Management Platform 轉型為 AI Work Platform,核心訴求是「人 + AI Agent 一起把事情做完」
四大 AI 產品線:Sidekick(個人助理)、Agents(自主工作者)、Vibe(AI 開發工具)、Notetaker(會議轉錄)
計費全面改成 AI 點數制:1 點 = $0.01 USD,所有產品共用同一單位
Casetify 用 5 個 Agent(Annie、AI 銷售管家、Eric、小蕾、AI 客服代表)跑完整 4 階段業務 lifecycle,專案準時交付率達 85%、ROI 5 倍
Enterprise 配套 Guardian add-on:TLE 帳號級加密 / BYOK 自帶金鑰 / DLP 資料外洩防護 / Multi-SSO
支援多 LLM(Claude、GPT、Gemini)+ AI Permissions Governance 中央後台,admin 可控制誰用什麼模型在哪個 workspace
誰該導入?5 種典型情境 + 6 個紅旗 + 4 種規模分水嶺 + 6 題自我檢核,文末有 50 人公司一年 TCO 估算(~$26,000–44,000 USD)

monday.com 是什麼?從 2026-05-06 開始,它已經不是「專案管理工具」了。官方在投資人新聞稿宣布公司史上最大轉型:從 Work Management Platform 變成 AI Work Platform。這篇文章把 2026 年 5 月在台北的 monday.com × EpiCloud 線下發表會內容完整整理,涵蓋產品線、計費、實際案例、企業安全四大層面,並對照官方資料做硬驗證。

什麼是 monday.com AI Work Platform?

AI Work Platform 是一個不只幫你 plan 工作、還能實際執行工作的 AI-first 平台。它的差異化來自四大核心支柱:

Native AI Agents — Agent 原生內建,非技術人員可以設定、部署、指揮
Integrated AI — AI 織進每一層,從 data block 到 full-page app
Unified Execution — Agent 用現有的 permissions、security、governance,跨部門讀活資料來 plan、coordinate、execute
Flexible AI Ecosystem — 一鍵接 Anthropic Claude、Microsoft 365 Copilot、OpenAI ChatGPT

它為什麼能跑?關鍵在 monday 本身的統一資料模型(boards / items / owners / statuses / timelines / dependencies)— 這層結構化、一致的資料,就是 AI Agent 可以 query 和 act 的 context layer。對比一般 AI 工具,這是有結構化資料當地基,不是空中樓閣。

四大 AI 產品線:Sidekick、Agents、Vibe、Notetaker

monday Sidekick — 個人 AI 助理

2026 年 1 月正式脫離 beta,目前是 monday 平台 AI 的中央入口。Sidekick 是 context-aware 的,跨 boards、docs、人員理解你的工作。能力涵蓋:

Generate Workflows:一句話描述需求,自動建出完整 board(含 columns、groups、automations)
Summarize:多 board 進度、updates 自動摘要
Chat command 執行:直接在對話中建任務、改狀態、指派
Surface insights:主動抓延遲、建議 follow-up、highlight 趨勢
Sidekick Voice:語音互動,重要動作會先確認

monday Agents — 自主 AI workforce

Agents 是 monday 在這次轉型的旗艦產品。定位上叫「unlimited workforce」,代表人類自主執行任務。應用場景包括:行銷活動草稿、銷售 lead qualifying、support ticket 處理、員工 onboarding、採購單。

新基礎建設讓 Agent 可以自行 sign up、authenticate、在平台內操作 — 換句話說,Agent 在 monday 裡是一等公民,跟人類員工同 UI 模型。在現場 demo 看到的 Campaign Planning Agent「Jennie」就是典型範例:有名字、有頭像、有人設、可被 @mention、可指派為 board item 的 owner、有 Brain tab 儲存長期記憶、有活動紀錄做 audit trail。

monday Vibe — AI 開發工具

Vibe 是讓非工程師用自然語言建客製化 view、dashboard、mini-app 的工具。對應前面 Sidekick 的「Generate Workflows」往上延伸:不只是 board,連完整 app 都能無 code 蓋出來。

monday Notetaker — AI 會議助理

邀進會議 → 即時轉錄(支援 Zoom、MS Teams、Google Meet)→ 自動產出 summary、transcript、影片錄影、action items,全部回流到 monday workspace。產出可以推到 Gmail、Slack 或其他外部工具,也可以直接寫入 CRM 的 deal timeline,讓業務不用會後手動 update。

AI 計費:Consumption 點數制,1 點 = $0.01 USD

2026 轉型同時 monday 把計費全面改成點數消耗制 — 所有 AI 產品共用單一計價單位「AI 點數(每月)」,1 點 = US$0.01。各產品的消耗速率如下:

產品	消耗速率
monday Agents	10–250 點 / 任務(視深度範圍)
monday Notetaker	120 點 / 小時會議 = $1.20 USD/hr
monday Sidekick	暫時免費(平台 AI 入口策略)
monday Vibe	已發布 App + 1 張 Vibe Prompt ≈ 30 點
monday Workflows	啟用中的工作流,每次 AI infused 執行 = 8 點

Vibe Prompt 按模型分級計費

Vibe 的 prompt 開始按模型消耗點數,使用者要自己決定 cost/quality trade-off:

模型等級	模型	點數 / 則 prompt	換算美金
輕量	Gemini Flash	~10–20	$0.10–0.20
中等	Claude Sonnet	~30–50	$0.30–0.50
最佳	Claude Opus	~50–500	$0.50–5.00

關鍵觀察:Opus 一次 prompt 最高 $5 USD,monday 顯然把模型成本直接透傳給用戶 — 它自己也賠不起 Opus。這也回應業界對「AI 訂閱燒錢」的普遍焦慮:有 ROI 就用最強,沒有就退回 Flash。

各 Plan 點數方案:Basic 卡很死,Enterprise 強制 25 席起

Plan	起購	中階	高階	頂規
Basic	1,000 點 ($10)	—	—	—
Standard	2,000 點 ($20)	4,000 ($40)	8,000 ($80)	—
Pro	3,000 點 ($30)	4,000 ($40)	8,000 ($80)	20,000 ($200)+
Enterprise	席次 × AI 點數套裝組合 — 固定比例 1 席:800 點,最低 20,000 點(= 25 席起跳)

Basic 1,000 點換算:大約跑得了 8 小時 Notetaker、4 次深度 Agent 任務、或 2 次 Opus 高階 prompt — 真正要用,馬上得升 Standard 以上。

CASETiFY 實戰案例:5 個 Agent 跑完整業務 lifecycle

CASETiFY 是全球 D2C 品牌,從手機殼起家,業務節奏跟 iPhone / Galaxy 新機同步、不停聯名 drop。100+ 國家營運、monday 使用者超過 300 人(2019 年 15 人起跳)。他們透過 AWS Marketplace 採購 monday Enterprise,把 AI 嵌進每個業務階段。

4 階段 × 5 個 Agent 接力

階段	Agent 名稱	AI 前 → AI 後
1. 規劃行銷活動	Annie(行銷規劃 Agent)	人工策劃 → 自動化規劃,提升生產力
2. 創造商機(qualification)	AI 銷售管家	人工流程 → 自動規劃,更高價值互動
2. 創造商機(outreach)	Eric(銷售 Agent)	與管家分工:打電話、寄信、排會議
3. 專案執行	小蕾(專案管理員)	遭遇風險 → 籌備下一步,減少交付延誤
4. 客戶支援	AI 客服代表	人工分流 → 智慧分流,降低單一工單成本

關鍵設計:商機階段刻意用兩個 Agent 分工(qualification 跟 outreach 分開),不是一個 super-agent 包山包海。Agent 之間透過 board 的 status 跟 column 接力,不直接 agent-to-agent 通訊 — 跟人類團隊 SOP 的 hand-off 邏輯一樣。

量化成果

指標	數字
專案準時交付率	85%
Scope creep 下降	20%
ROI	5x
PM 被追問 ticket 下降	~30%
內部溝通成本下降	20–30%

CASETiFY 一年處理 600–700 個內部請求,過去靠 email + Excel + Slack 來回。導入 monday 之後,他們建了三種 board:Intake Boards(標準化請求收件)、Project Delivery Boards(可重複使用 template)、Capacity Planning Boards(產能 dashboard)。AI 做的事:長 submission 自動摘要、自動分類派工、跨語言翻譯、情緒偵測標記緊急請求。

Growth PM Charlotte Chan 的原話:「我們一直收幾百個 request,但根本看不出有什麼進來、哪些重複、各自要花多少力氣。沒有透視度,計劃就會變成被動反應。」Engineering Director Terence Fung 補充:「monday 最大價值是真正統一的工作區 — 打掉部門 silo,讓跨團隊協作 seamless。」

企業安全:Guardian add-on + AI Governance

monday 對 enterprise 客戶開出兩道防線:資料層 Guardian add-on,治理層 AI Permissions Governance。

Guardian add-on(Enterprise 專屬)

Tenant-Level Encryption (TLE):每個帳號專屬加密金鑰,定期輪替,跟其他客戶物理隔離
Bring Your Own Key (BYOK):金鑰存在你自己的雲端 KMS,你 100% 控制整個 lifecycle。撤銷 key = monday 立刻看不到你的資料(kill switch)
Data Leak Prevention (DLP):Admin 定義掃描規則,監控 updates 跟上傳檔案,自動執行政策
Multiple SSO:同帳號可配置多個身分驗證源(Okta + Azure AD + Google Workspace),適合併購整合場景

AI Permissions and Governance

Enterprise admin 中心提供兩個 tab:

AI Permissions Tab:控制哪些 role 能用 AI、在哪些 workspace 能用、用哪些 agent — 可細到單一 agent,也可一鍵套整體 default
Agent Directory Tab:全公司 Agent 的中央 dashboard,顯示 agent 名字、owner、sharing 狀態、目前狀態、asset access、建立日期、使用的模型。一鍵 activate / deactivate(等同「開除」Agent)

支援的 LLM:Anthropic Claude、OpenAI GPT、Google Gemini,Sidekick 內建會為不同任務挑模型。對應前面 Vibe 那張 prompt 計費表 — 用戶或 admin 都能控制 cost/quality 平衡。

合規認證一覽

monday Trust Center 公開的清單:SOC 1/2/3 Type 2、ISO 27001 / 27018 / 27017 / 27032 / 27701、GDPR、HIPAA、CCPA、LGPD、PIPEDA、APPI、EU-US DPF、TX-RAMP、CSA STAR Level 1。資料中心 3 個 region:US、EU(法蘭克福)、APAC,全部跑在 AWS。

一個容易踩雷的細節:即使選 EU region,monday 自家的 metadata(使用者憑證、profile、usage analytics)仍然存在 US — 只有 Customer Data 在 EU。法務團隊評估時這點要算進去。另外,region 由「第一個開帳號的人位置」自動決定,一旦設定不能改,真要從 US 遷 EU 得走特殊流程。

誰該導入 monday.com AI Work Platform?

講完功能、看完案例之後,真正的問題是:你公司適合導入嗎?monday 是個強大的平台,但不是萬靈丹。下面用情境、紅旗、規模、產業四個維度幫你判斷。

5 種典型適配情境(這些情境,monday 真的會發功)

情境	特徵	對應 monday 能力
1. 大量標準化請求	一年幾百到幾千筆內部 request,目前散在 email/Slack/Excel	Intake Form + AI 自動摘要分類派工(像 CASETiFY 600–700 件/年)
2. 跨部門 silo 嚴重	行銷、業務、IT、客服各跑各的系統,資料對不起來	統一資料模型 + Agent 跨 board 串聯
3. 業務 lifecycle 清楚分階段	行銷 → 商機 → 執行 → 客服,每階段有 SOP	多 Agent 接力,Board 當 handoff 介面(CASETiFY 5 Agent 模式)
4. 重複性高的 knowledge work	triage、分類、摘要、寫 brief、follow-up 占工時 30%+	Sidekick + Agents 自動化這些低 judgement 任務
5. 跨國跨語言團隊	中英日韓夾雜,異地協作,時區跨度大	AI 自動翻譯 + 24/7 Agent 接力(CASETiFY 100+ 國家)

6 個紅旗 — 出現這些就先別碰

🚩 流程根本沒標準化 — 同樣的 request 每次都重新討論一次。Garbage in, garbage out,AI 只會把混亂變得更快更貴
🚩 團隊 <10 人 — Basic plan 1,000 點只夠玩,要功能必須升 Standard。Enterprise(Guardian + 治理後台)強制 25 席起跳
🚩 高度監管需要私有部署 — monday 是 cloud-only,銀行核心、醫療 EMR、政府內網不適合(只有 EU/US/APAC 三個 AWS region 可選)
🚩 沒結構化資料基礎 — 還在用 Excel 跑生意、業務資料在每個業務私人筆記本裡。沒有 board / status / owner 概念,AI 沒有 context layer
🚩 一次性專案、不重複的工作 — Agent 的價值在於規模化重複任務,單一專案直接找顧問划算
🚩 只算 seat 費沒算 AI 點數 — 算 TCO 時忘了 Notetaker 120 點/hr、Vibe Opus prompt 最高 500 點/則 — 50 人團隊月跑 5 萬點 = $500 USD 是常態

按企業規模看 ROI 分水嶺

規模	建議 Plan	適配度	關鍵考量
1–10 人	Basic / Standard	⚠️ 弱	AI 點數太少,Notion AI / ChatGPT Team 更划算
10–50 人	Standard / Pro	✅ 中	Pro 點數彈性大,Vibe 應用 3 個夠用
50–300 人	Pro(頂規 20,000 點)	✅ 強	最甜蜜點,有規模又不必上 Enterprise 門檻
300+ 人	Enterprise + Guardian	✅ 強	BYOK / DLP / Multi-SSO / AI Governance 全套

關鍵分水嶺:25 席 — Enterprise 強制最低 20,000 點 ÷ 800 點/席 = 25 席。10–25 人公司想要 BYOK 或多重 SSO,只能升到 25 席買 Enterprise,可能多花預算為了用不到滿的功能。這是台灣中型企業最常踩的雷。

按產業看適配度

產業	適配度	原因
D2C / 電商 / 行銷代理	🟢 強適配	流程清楚、跨團隊協作密集、CASETiFY 即範例
SaaS / 軟體 / 專業服務	🟢 強適配	數位化原生,intake/triage 量大
製造業 / 營造	🟡 中等	看數位化深度,ERP 整合是關鍵
教育 / NGO	🟡 中等	流程適合但預算敏感,Notion / Trello 替代
金融核心 / 醫療臨床	🔴 弱適配	監管要求私有部署,monday cloud-only 不符合
傳產零售第一線	🔴 弱適配	第一線員工不在電腦前,行動端體驗有限

導入前 6 個自我檢核問題

在掏錢前,先回答這 6 題。**5 題以上答得出來才繼續,否則先回去修內功**:

你的 intake 已標準化了嗎? — 同一類請求每次都用同一張表收?還是看心情寫 email?
你有 SOP / template 文化嗎? — 新員工三個月內能複製資深人員的工作流?還是每個人自己土法煉鋼?
Stakeholder 習慣自己看 dashboard 嗎? — 主管會主動看數據還是等 PM 報告?自助看 = monday ROI 的核心
既有 SaaS 整合是否齊全? — Gmail / Slack / Calendar / Drive 用得熟?還是還在內部架 Lotus Notes?
法務 / IT 已對 AI 治理有共識嗎? — BYOK / 區域留存 / 不訓練第三方 — 法務願不願意簽?
你算過真實 TCO 了嗎? — Seat 費 + AI 點數 + Guardian + 變更成本(培訓、流程改寫)— 不只是 sticker price

真實成本估算:50 人公司跑一年

以一家 50 人公司 Pro plan 為例(粗估,實際以業務報價為準):

項目	估算
Pro 月費 × 50 席 × 12 月	~$15,000–18,000 USD/年
AI 點數(月跑 50,000 點 ≈ $500)× 12	~$6,000 USD/年
Notetaker(50 人 × 月平均 4 hr 會議)	~$2,880 USD/年(內含於 AI 點數)
變更管理(培訓 / 流程改寫 / 顧問)	$5,000–20,000 USD(一次性)
第一年總計	~$26,000–44,000 USD

對應 CASETiFY 報的 5x ROI:他們省下的等於 $130,000–220,000 USD/年(主要是 PM 時間、溝通成本、減少漏單)。回本期通常 6–12 個月,前提是真的把流程改了,不是買來放著。

變革管理 3 個重點(CASETiFY 經驗萃取)

先 1 個 board 起家 — 不要一次全公司導。CASETiFY 是 2019 年從 IT 一個 board(2 天建好)起步,慢慢擴散到 300 人。先有第一個成功案例,再橫向複製
找到一個 sponsor + 一個 super user — Sponsor 給預算和政治支持(通常是 COO/CIO),super user 教全公司怎麼用(通常是 PM 出身)。少一個都會失敗
Agent 命名 + 人設 = 採用率關鍵 — CASETiFY 把 agent 取名 Annie、Eric、小蕾,有頭像有人設。研究顯示員工對「同事 Agent」採用率比「工具 AI」高 2–3 倍。心理門檻才是真門檻

5 個導入原則(把 CASETiFY 經驗壓成一頁)

先標準化 intake — 沒這層,AI 都白搭。垃圾進垃圾出
Template 化專案 — 不是每次重畫流程,踩過的坑變模板
Dashboard 給 stakeholder 自助看 — 主動降低被追問次數,CASETiFY PM 被追問下降 30%
AI 嵌進去 ≠ 取代人 — 加速 triage,judgement 在人身上。Agent 是擴增,不是替代
monday 不是孤島 — CASETiFY 同時用 Databricks 跑資料層,monday 跑工作流層。要跟既有 stack 共存才有用

最後一個容易被忽略的點:CASETiFY 的後端不是只有 monday — 資料層用 Databricks 統一資料湖,千萬級 SKU 平行跑模型。monday 不是孤島,要跟既有的資料 stack 共存才有用。如果你以為買了 monday 就能取代既有 ERP / CRM / BI,那是把工具當銀彈,通常會慘賠。

結語:從工具到工作平台的範式轉移

2026-05-06 這個日子,在工作管理軟體史上會被記住。monday.com 不只發新功能,而是整個產品定位重新定義 — 從「給人類用的工具」變成「人 + AI Agent 一起工作的平台」。Agent 在這個架構裡是 first-class citizen:有名字、有頭像、可被 @mention、可指派為 owner、有 Brain 記憶、有 audit trail、可被 admin 開除。

對台灣中型企業來說,真正要決定的不是「要不要導入 monday」,而是「業務流程準備好讓 Agent 接手了嗎」 — Intake 標準化了嗎?Template 化了嗎?Dashboard 給 stakeholder 自助查的習慣建立了嗎?CASETiFY 那 85% 準時交付、5x ROI 不是 AI 變出來的,是 7 年累積的流程紀律加上 AI 放大。AI 是放大器,放大的是你既有的流程品質。如果流程本身是亂的,AI 只會把混亂變得更快、更貴。

2026 年 5 月 26 日

Claude Code 訂閱 6/15 拆分:一個 Max 用戶的 evidence-based 評估與本地化反轉

重點摘要

Anthropic 在 2026/6/15 把 Claude 訂閱拆兩半:互動式(終端機 Claude Code、IDE、claude.ai)維持訂閱補貼價,**程式化(Agent SDK、claude -p、GitHub Actions、第三方包裝)移到獨立 metered credit pool**,按 API 全價算。
對「個人坐下來打字 + 派 Agent Team」這種使用方式,**影響幾乎是零**;真正會被打到的是把訂閱接到 Python 程式跑 24 小時 agent army 的套利型用法。
但「字面合法、精神鑽縫」的灰色地帶會持續存在 — Anthropic 隨時可以用 fair use 條款補洞,你不會收到通知。**真正的應對是把 LLM 從 service 變 commodity**:本地優先 + cloud burst 的 gateway 架構。
2026/5 當下的本地 stack 已經追平 frontier:Qwen 3.6-27B 在 agentic coding 上達到「半年前 400B 級」水準,DeepSeek V4-Flash 用 MoE 把 1M context reasoning 壓到 33GB 量化版可跑。**Claude API 從 default 降級成 escape hatch**。

2026 年 5 月中,Anthropic 連續宣布三波 Claude Code 政策變動。5/6 把 5 小時池額度直接 ×2、Pro/Max 取消尖峰時段;5/13 週池額度 +50%(到 7/13 結束的補貼期);最關鍵的是 5/14 預告、6/15 生效的「訂閱拆分」政策 — 把程式化用量從訂閱補貼池移到獨立 metered credit pool。

這篇文章是我作為一個 Claude Max 訂閱用戶,用 21 個 transcript 實際 audit + 政策原文交叉比對的 evidence-based 評估。涵蓋:三波變動的精確時間軸、Anthropic 拆分的真實業務動機、不同使用模式落到新政策的具體影響、灰色地帶與真實風險,以及用 Qwen 3.6 + DeepSeek V4 反轉成「本地優先」工作架構的可執行路線。

三波政策變動的精確時間軸

2026/5/6 — 5 小時池 ×2、尖峰取消。Claude Code 五小時池對 Pro / Max / Team / 企業版直接加倍。Pro / Max 取消「peak hours」限制。Claude API 的 Tier 1 input tokens 上限 +1500%、output tokens +900%。背景是 Anthropic 跟 SpaceX 簽算力協議,Colossus 1 設施提供 300MW 額外容量、超過 220,000 NVIDIA GPU。

2026/5/13 — 週池 +50%(臨時加碼到 7/13)。週限額提升 50%,適用於 Pro / Max / Team / Enterprise。這是限定期加碼,7/13 之後會回到原本水準(除非 Anthropic 再續延)。業界解讀是 Anthropic 對抗 OpenAI Codex 搶 agent 市場的動作。

2026/6/15 — 訂閱拆兩池(真正的結構變動)。訂閱使用從這天起分成兩個池子:

使用方式	6/15 後歸屬	計費邏輯
終端機 / IDE 內互動式 Claude Code	互動池(訂閱)	不變
claude.ai 網頁 / 桌面 / 手機	互動池(訂閱)	不變
Claude Cowork	互動池(訂閱)	不變
`claude -p` 無頭模式	Agent SDK Credit Pool	按 API 全價
Claude Code GitHub Actions	Agent SDK Credit Pool	按 API 全價
Claude Agent SDK(Python/TS)	Agent SDK Credit Pool	按 API 全價
第三方包裝(OpenClaw / Conductor / Zed / Jean)	Agent SDK Credit Pool	按 API 全價

SDK Credit Pool 額度按訂閱方案分配:Pro $20、Max 5x $100、Max 20x $200,Team Standard $20/seat、Team Premium $100/seat。額度不滾存,每月歸零。耗盡後可選擇 enable overage(繼續按 API 全價收費)或 disable overage(請求被 reject)。

Anthropic 為什麼要拆?

訂閱政策本來是「個人吃到飽」設計。Anthropic 賭你打字慢、思考慢,$20 一個月吃不爆等值的 API token 量。這個賭注在「個人開發者用 Claude 寫 code」場景下成立 — 一個人類一天寫不了 10 萬行的對話。

但 Claude Agent SDK + 第三方包裝(OpenClaw、Conductor、Zed、Jean)讓人可以把 $20 訂閱接到自己寫的 Python 程式,24 小時不停跑 agent army,實際 token 量遠超過 $20 等值。等於把吃到飽 buffet 整個載走轉賣 — 訂閱被當成「便宜 API」用於 production 流量。

Anthropic 沒禁這條路,只是把它改成獨立 metered 預算 — 「載走轉賣」要另外算錢,「個人坐下來吃」不動。順便擋住 OpenAI Codex 用低價搶 agent 市場,也保住 unit economics 才有錢付 SpaceX 那 300MW 算力擴張的帳。

實際使用模式 audit:21 個 transcript 看出什麼

政策評估不能憑印象,要有實際使用 evidence。我盤點過去 28 天的 Claude 使用情況:

21 個 transcript / 13 個唯一日期:不是每天用,平均一週 3-4 天
互動式為主:全部 transcript 都是終端機 Claude Code session,不是 SDK / API 程式化呼叫
ccbot Telegram bridge:bridging interactive session,不是獨立 inference
5 個 claude-harness-* hook:全是 SessionStart / PostToolUse / PreCompact 注入,在 session 內運行
claude-limited cgroup wrapper:也是互動 session 內
Agent Team 18-25 並行:從 interactive session 用 Agent tool 派
/loop, /schedule, GitHub Actions, 第三方包裝:全沒有
crontab 11 條:全是 stock data 收集(analyst / TDCC / 機構投資人),完全不叫 Claude
唯一例外:某個內部 LLM 評估 harness 有一條 subprocess.run(["claude", "-p", ...])

把這份 audit 對照 6/15 政策表格,結果出奇地簡單:21 個 transcript 裡有 20 條繼續走訂閱池,只有 1 個 evaluation harness 那條 claude -p 會搬到 SDK Credit Pool。

政策真正落到「典型重度使用者」頭上的點

對於從終端機 / IDE 互動式使用 Claude Code、用 Agent tool 派 subagent、寫 brain / skill / memory 系統的人 — 也就是 Anthropic 設計訂閱時瞄準的客群 — 6/15 變動實質影響趨近於零。

真正被打到的只有四類具體模式:

把 claude -p 串進 shell pipeline 或 CI/CD:每次 invocation 從訂閱池移到 SDK Credit Pool
用 Agent SDK 寫的 Python / TypeScript 程式:無頭運行的 production agent,完全脫離訂閱
Claude Code GitHub Actions:CI/CD 整合在 workflow 內呼叫 Claude
第三方包裝:OpenClaw、Conductor、Zed、Jean 這些把 Claude 訂閱接成 IDE 後端的工具

如果你已經習慣「人在前面打字,Claude 在後面派 agent 跑」的工作模式,這個政策變動就是 一個不會發生的事件。

灰色地帶:cycle + Agent Team 字面合法但精神鑽縫

但有一種模式介於兩者之間,Anthropic 官方文件沒明寫:從 interactive session 派出大量 Agent Team,搭配 /loop 或 hook-based cycle 讓 session 自動延續。

技術上這完全合法。6/15 政策字面只點四個對象:claude -p、Agent SDK、GitHub Actions、第三方包裝。「cycle + 大量 Agent Team + 自動啟動循環」如果全部跑在 interactive Claude Code session 裡(用 Agent tool 派、用 /loop 接同 session、用 hook 觸發),技術上會被歸到互動池。

但這顯然是「字面 vs 精神」的縫。Anthropic 拆這條政策的精神,就是要擋「沒人盯每一回合的大量自動化」 — 第三方分析給出的啟發式是:「if a Claude session runs without a human watching each turn, it is almost certainly moving to the new credit pool」。從這個精神判讀,大規模並行 Agent Team + 自動 cycle 精神上根本就是 programmatic,只是技術上沒被點名。

兩個現實風險

風險一:這個縫不會永遠在。Anthropic 看到統計上的 outlier 用戶(Max 訂閱跑出 Tier 4 API 等級的 token 量),下一輪政策補刀的機率不低。半年後可能變「subagent 從 interactive 派也算 programmatic」、或「同 session 自動 cycle 超過 N 次轉計費池」。歷史上 Anthropic 對訂閱濫用模式都是先觀察後動手 — 5/14 這次拆分本身就是這個 pattern 的證據。

風險二:Fair use 抽象條款隨時可以動你。Terms of Service 寫的「abuse / excessive use」沒精確定義,他們覺得單帳號太誇張就可以單獨 throttle 你帳號,不需要先改政策、不需要事前通知。被點到的人通常只看到「Claude 突然變慢 / 限額變嚴 / 某些 tool 失效」,不會收到正式告知信。

精確版說法:「字面合法、精神鑽縫、風險押在 Anthropic 不回頭補洞」。在他們補洞之前你賺,補了之後可能在毫無預警的下次續訂看到 SDK credit 開始扣 — 或更早,某一天突然發現自己被限流。

反轉戰略:從 service 用戶變成 commodity operator

真正的應對不是「擠到最後一秒用爆」,是 把工作系統的依賴從 Claude 拆出來,讓 LLM 變成可替換的 commodity。這個轉變的本質是反轉預設值:

層級	現在(service 模式)	反轉後(commodity 模式)
日常 code / reasoning	Claude 預設,本地 fallback	本地預設,Claude API 偶爾 burst
Agent Team	Claude 的 Agent tool	本地 orchestrator + 多 model 異質並行
超長 context	Claude API	Qwen 3.6 / DeepSeek V4 / Gemini 三家擇優
A 級 PII / 客戶名 / 合約	本地 7B(品質不夠)	本地 70B 級,品質可用且不上雲
vendor lock-in 風險	Anthropic 政策變動 = 工作系統危機	改 gateway config 而已

架構的關鍵是 gateway 抽象層:用 LiteLLM 或自己寫一個薄 wrapper,讓所有 code 對外只看到一個介面 llm.complete(prompt, model_tier="cheap|standard|premium")。底下接什麼模型是 config,不是 code。Claude 政策再變、Anthropic 真的把帳號限流、OpenRouter 出新便宜模型 — 改一個 config 全部換完,所有專案不動。

2026/5 最新 open weights stack:本地能跑什麼

2026 中的 open weights 市場已經到「local 27B ≈ 半年前的 frontier closed」階段。對於配備獨顯 + 100GB+ RAM 的工作站,實際可選的本地 stack:

Qwen 3.6 系列(2026/3-4 發布)

Qwen 3.6-27B(dense)— flagship 級 agentic coding,Q4 約 14GB VRAM。官方宣稱超越上一代 Qwen 3.5-397B-A17B,即「27B 在 2026 ≈ 半年前 400B 的水準」
Qwen 3.6-35B-A3B(MoE,35B 總參數 / 3B 啟動)— Q4 約 18GB。MoE 設計每次只算 3B 參數所以很快,適合並行 Agent Team
Qwen 3.6 Plus / Max-Preview — closed weights API only。Plus 在 Terminal-Bench 2.0 已贏 Claude 4.5 Opus(61.6 vs 59.3),SWE-bench Verified 還小輸(78.8 vs 80.9)。1M context、reasoning 預設。當 cloud burst 比 Anthropic API 更划算

DeepSeek V4(2026/4/24 發布)

V4-Flash:284B 總參數 / 13B 啟動 MoE,完整模型需 ~170GB VRAM,重度量化壓到 33GB VRAM 可跑(2× RTX 4090 或 1× RTX 6000 Ada)
V4-Pro:1.6T 總 / 49B 啟動 — 100GB RAM 跑不了,跳過
1M context native,hybrid attention(CSA + HCA)推理 FLOPs 比 V3.2 省 73%
這是「反思 / 跨領域類比」的本地頂配

Llama 3.3 70B 與其他

Llama 3.3 70B ecosystem 最大,Q4 約 35GB。不再是 2026 中的首選,但作為「異質 diversity」角色仍有意義 — 同一 task 給不同 model 看,異質訓練資料能產生 outlier insight,單一 model 並行做不到。

100GB+ RAM 機器的實際配置

100GB 對 Qwen 3.6 系列來說是過剩配置。所以這台機器的設計目標不是「能跑大 model」,是「多 model 並行讓 Agent Team 有真實 diversity」:

常駐 hot 在記憶體(同時 load):
├── Qwen 3.6-27B  → 主力 code / 對話       (~14GB)
├── Qwen 3.6-35B-A3B → 快速 Agent Team 主體 (~18GB,MoE 跑很快)
├── DeepSeek V4-Flash 量化版 → reasoning 深度  (~33GB)
└── Qwen 3.6-7B 之類 → 路由 / 簡單分類     (~5GB)
總計 ~70GB,留 30GB 給 vLLM cache + OS + agent 並行 context

按需 load(cold,需要時起):
├── Llama 3.3 70B Q4 → 異質 diversity 用    (~35GB)
└── 其他特殊微調 model

Cloud burst 的新排序

在 2026 中的市場狀態下,Anthropic API 不再是首選 burst 選項。新排序建議:

Qwen 3.6 Plus API(阿里雲)— 主 burst。超長 context + 一般複雜任務。價格約 Claude Sonnet 的 1/3,Terminal-Bench 已贏 Claude 4.5 Opus
Gemini API(Google)— multimodal / OCR / 大文件處理
DeepSeek V4-Flash API — reasoning 硬 case 沒本地版時的備援
Claude API — 只有「Anthropic 那條 reasoning 風格特別合用」的 edge case 才開,從 default burst 降級成偶爾用一下的特殊風味

架構全景圖

把上面所有層拼在一張圖上:應用層 → LiteLLM gateway 路由 → 本地 vLLM(95% 流量)+ Cloud burst(5%)→ 底層 model-agnostic 的 brain / skill / memory data layer。

APPLICATION LAYER
Aider · Open WebUI · Custom Agent Orchestrator(walsin/teams 通用化)

↓

OpenAI-compatible API

LITELLM GATEWAY
routing rule = config,不是 code

task tier	→	backend
code / chat	→	LOCAL Qwen 3.6-27B
Agent Team	→	LOCAL Qwen 3.6-35B-A3B(MoE,快)
reasoning	→	LOCAL DeepSeek V4-Flash(量化)
routing	→	LOCAL Qwen 3.6-7B(輕量分流)
超長 context	→	CLOUD Qwen 3.6 Plus API(1M ctx)
multimodal	→	CLOUD Gemini API
edge reasoning	→	CLOUD DeepSeek V4-Flash API
特殊風味	→	CLOUD Anthropic API(escape hatch,不是 default)

↓

LOCAL(~95% 流量)
vLLM on 100GB+ RAM + GPU

HOT(同時 load):

Qwen 3.6-27B — 14GB
Qwen 3.6-35B-A3B(MoE)— 18GB
DeepSeek V4-Flash 量化 — 33GB
Qwen 3.6-7B 路由 — 5GB

合計 ~70GB,留 30GB 給 vLLM cache + agent 並行 context

COLD(按需 load):

Llama 3.3 70B — 異質 diversity
特殊 fine-tune

CLOUD BURST(~5% 流量)
按 token 計費,非訂閱

Qwen 3.6 Plus — 阿里雲(主 burst)
Gemini API — Google
DeepSeek V4-Flash API
Anthropic API — 偶爾用 only

用途:
• 超長 context (>32K)
• 圖片 / OCR
• 本地解不出來的硬 case
• A 級 PII 絕不出現在這層

↓

DATA / MEMORY LAYER (model-agnostic,完全不動)
Brain.md · Skill.md · Iron Rules · Session Log · RAG Index

	Before(service 模式)	After(commodity 模式)
預設 backend	Claude,Ollama 是 fallback	本地,Cloud API 是 burst
vendor 變動風險	Anthropic 政策動 = 工作系統危機	改一行 LiteLLM config 全部換完
A 級 PII 路徑	本地 7B(品質不夠)	本地 70B 級(品質可用且不上雲)

這張圖的核心訊息:所有 vendor 都在 gateway 後面,application code 完全不知道下面是誰。Claude 政策再變、Anthropic 真的把帳號限流、阿里雲漲價、Gemini 改 API — 改一個 routing config 全部換完,brain / skill / memory data layer 一行不動。

軟體 stack 建議

vLLM — inference server,提供 OpenAI-compatible API。Code 對外就是 OpenAI 格式,model 可以隨時換
LiteLLM — gateway 抽象層。前面接所有 backend(本地 vLLM + Anthropic API + Gemini + Kiro)。Code 只認 LiteLLM,backend 換不換無感
Open WebUI 或 Aider — 取代 Claude Code 對話介面的 interactive REPL
自家 agent orchestrator — 不要依賴 Claude 的 Agent tool,自己寫 multi-process 派發。pattern 可以參考開源的 CrewAI、AutoGen,或像我自己有的 ABC 三級分流 evaluation harness 通用化

過渡期(現在到 6/15)該做的事

建立 baseline metric:從今天開始每天結束前記錄 claude /usage 截圖或 log 到檔案。沒 baseline,出事時你連「被砍多少」都判斷不出來
盤點所有 claude -p 用法:grep -rn "claude -p" ~/ 找出來。每一條都是 6/15 後會從訂閱池搬家的成本點
後備模型 stack cheat sheet:寫一份 1 頁文件「如果 Claude 突然不能用,brainstorming 切去 X、code review 切去 Y、daily 工作切去 Z」。不要等出事才想去哪找
Agent Team 預設規模降到 6-8:18-25 改成「報備使用」。這同時對抗 token 燒速、降低被點為 outlier 的機率,順便逼自己思考「真的需要這麼多視角嗎」
5/20 到 7/13 是補貼期:互動池 +50% 週限額。這 8 週是 Agent Team 衝刺 / 大規模 refactor 最划算時段

真的被限流了怎麼辦

先診斷不要先動作。連 Anthropic console 看是哪一條被扣 — credit pool 被扣 vs 互動池速率變慢是兩個完全不同問題,處理方法不一樣。

立刻把 hot path 切到備援。Agent Team 規模直接砍半、evaluation 暫停或全切非 Claude 後端、日常工作切 Ollama 本地 + Gemini 雲混合。這幾個動作 1 小時內要能做完,不是出事當下才開始研究。

正式申訴 + 評估升 Max 20x。如果你判斷被誤分類(明明是 interactive 被當 programmatic),開 ticket 跟 Anthropic 講。同時評估:接下來工作密度有沒有可能升 Max 20x,把 $200/月 credit 當成「事故緩衝」不是「正常用量」。

結語:訂閱不是 token 額度,是時間窗

最重要的觀念修正:你訂閱 $100/月給你的不是「token 額度」,是「Anthropic 暫時容忍你這種重度用法的時間窗」。這個窗會關。準備的本質是「窗關了我有沒有別條路」,不是「擠到最後一秒用爆」。

反轉成本地優先 + cloud burst 的真正好處,不是省那 $100/月,是 把 LLM 從 service 變成 commodity。你不再是 Anthropic 的 user、Google 的 user、阿里雲的 user,你是一個有自己 stack 的 operator。任何一家政策變、漲價、限流、倒閉,你都只需要改一個 config。

對 2026 中要進企業環境推 LLM 的人來說,這個論述也是直接合規上的加分 — 集團真實場景就是要 A 級 PII 不上雲、不能綁單一 vendor、不能讓核心評估綁在個人帳號上。本地優先架構直接符合這三條,不需要為了合規綁手綁腳。

Anthropic 6/15 拆分對「個人坐下來用」這群人是非事件。但它送出的訊號很清楚:訂閱補貼的時代正在收窄,LLM 市場往真實計費走。早一步做反轉的人,不是因為政策才動 — 是因為看到方向,提早把脆弱性拿掉。

2026 年 5 月 20 日

腦子系統壓軸:萬人製造集團 AI 治理 1 年實戰藍圖

重點摘要(TL;DR)

腦子系統前 7 篇是理論藍圖。本篇是萬人跨國製造集團 1 年實戰執行版:Day 1 到 M12 的 5 個 Phase Gate、三層治理、預算 NTD 4,000-6,000 萬具體 breakdown、22 個關鍵 gap、5 場真人會議。
骨架不是憑空寫的 — 經過 4 輪 AI agent review × 10 個 domain × 28 份 expert opinion:CISO / AI 治理 / ERP / 法務 / IT 架構 / 組織變革 / 製造業 BU senior / HR / CFO / 外部會計師。
核心心法 5 條:鄉村包圍欽點啟動、三條紅線下放、90 天法律化(非 30 天)、三道防線(內稽必須第三線獨立)、預算具體到 NTD 級距(非「中等到中高」)。
給 CIO 的訊息:這份藍圖的價值不是告訴你答案,是告訴你接下來要問哪 5 群真人哪些問題。
本文是腦子系統八部曲的壓軸實戰篇。前七篇:Why / How / Scale / Tools / ERP / Self-Service / ISO。

一、為什麼寫這篇

腦子系統前 7 篇講的是理論:為什麼這樣設計、怎麼蓋、怎麼擴展。但理論到實戰之間,有一條鴻溝 — 萬人跨國集團的真實政治、文化、預算、合規。

這個鴻溝不是 1 篇文章 + 1 個 IT 主管腦袋能跨過。我為一家萬人製造集團寫了完整的 1 年實戰藍圖,經過4 輪 AI agent review × 10 個 domain expert(總共 28 份 expert opinion)後,把所有 cross-confirmed 的議題壓縮成這一篇。

10 個 domain 包括:

CISO 資安(ISO 27001 + OWASP Top 10 LLM 紅隊)
AI 治理(ISO 42001 + 倫理 + 偏見)
ERP 架構(SAP / Oracle / iDempiere / Dynamics)
法務合規(個資法 / 營業秘密法 / GDPR / 勞基法)
IT 架構(K8s / Gateway / SRE / vLLM)
組織變革(萬人台灣集團 + 家族企業文化)
製造業 BU senior 主管(20 年資歷)
HR / 員工關係(第四輪新增)
CFO / 財務(第四輪新增)
外部會計師 / 內控(第四輪新增)

每一個 domain 都找出了前面 9 個 domain 沒看到的盲點。這是本文跟一般 AI 治理藍圖的根本差異:不是某個 IT 主管的個人見解,是 28 份不同視角壓縮的最大公約數。

二、戰略骨架(一句話)

鄉村包圍城市:三條集團紅線下放 → 各 BU 自然生長 → 根據地正規化 → Working Group 整理已發生事實 → 集團 Gateway 上線。

不從總部開始,從願意動的 BU 開始。起爆階段必須欽點(不能等自願)、擴散階段才靠拉力。

為什麼不用傳統由上而下:啟動成本太高、規範是空白紙上畫的(法務全判 A 級系統失效)、員工沒採用動機。

三、三條 Iron Rules + 90 天法律化(不是 30 天)

1. BOM 配方 / 製程參數 / 合金成分 / 熔煉 know-how
   → 禁止送任何雲端 LLM
   → 「送出」涵蓋: completion / embedding / vector / fine-tune /
     batch / log retention / 第三方 RAG
   → 違反視同營業秘密外洩

2. 未公告財報數字(月報 / 季預估 / 年度計畫 / 財務假設)
   → 禁止送任何 AI 工具(含本地)
   → 違反視同內線交易風險

3. 客戶合約 / 訂單金額 / 供應商報價 / 客戶聯絡資料
   → 禁止送雲端 LLM
   → 須脫敏後才可使用 AI 協助分析

第一個重大修正(來自會計師 review):CIO 一人簽 Iron Rules 在台灣上市公司治理上有重大瑕疵 — 涉及營業秘密 + 重大資訊管控屬資安政策層級,需經審計委員會或董事會核備。CIO 單簽日後查核會被會計師列 deficiency。

真實時程 90-120 天(原藍圖寫 30 天嚴重低估):

階段	動作	時間
Day 1	CIO 緊急發布(行政命令位階)+ 全員 email	1 天
Day 1-30	CISO 簽核 + 法遵核可	30 天
Day 30-60	工會協商(勞基法 § 70 細則,30 天起)	30 天
Day 60-90	工作規則修正報主管機關核備	14-30 天
Day 90-120	審計委員會核准 + 董事會決議	30 天

過渡期免責條款(會計師建議):Day 1-90 期間若違規,公司立合規導向處理(培訓 + 警告),不得作為解雇 / 賠償依據。否則「合理保密措施」舉證會被法院質疑。

工會協商失敗 fallback(HR review):Iron Rule 1(BOM)走營業秘密法 § 13-1 強制,不需工會同意;Rule 2/3 走員工自願同意 + 工具權限分流(不簽就限制 AI 工具,不解雇)。

四、五個 Phase Gate

Gate	月	通過硬條件
G0 啟動	M1	CIO 簽 Iron Rules + 任命準 CISO + 法遵 / 內稽通知
G1 種子	M3	至少 2 個 BU 各 5 人在用、無 Iron Rules 違反
G2 根據地	M4-M5	至少 2 BU 完成雙 Repo + 分級表 v0.1 + 脫敏字典
G3 包圍	M8	Working Group 4 場核心會議完成 + 集團 v1 + AIIA SOP + Iron Rules 走完董事會核准(若 M8 未完,fallback「議程已排定 + 審計委員會初審通過」)
G4 進城	M9-M10	Gateway + 雙引擎接入 + 北極星 70% + ERP MCP 1 BU 跑(用 Token Impersonation,不是 service account)
G5 稽核就緒	M12	內審完 + Gap 補完 + ISO 27001 + 42001 stage 1 audit 通過

五、三層治理結構(三道防線正確版)

第二輪 AI review 點出 v0.2 違反三道防線(內稽應第三線獨立),v0.3 大幅修正:

[第二線:管理]
├─ Steering Committee(每季 sponsor)
│  └─ 家族成員 / 總經理室掛名,不參與每月運作
│  ⚠️ 議事規則明文「不得對 Working Group 個案決議下指導」+ 會議錄音
│
└─ Working Group(7-8 人,雙週例會,治理者)
   ├─ 準 CISO(主席)
   ├─ 法務 / 法遵代表
   ├─ IT/RD 代表
   └─ 3-4 BU senior 代表

[第三線:獨立監督]
└─ AI 治理監督委員會(每季,獨立)
   ├─ 內稽處長(召集人,雙線報告:行政→CIO,職能→審計委員會)
   ├─ 1 名獨立董事
   └─ 外部顧問(由審計委員會選聘 + 預算獨立 + 3 年輪換)

   季度 audit Working Group 自身 + Gateway log + bias probe
   直接向審計委員會報告(不經 CIO)

[第一線:執行]
└─ BU 內部
   ├─ BU Curator(技術骨幹,每週 45 分跑 PR)
   ├─ BU Senior 把關人(每週 15-30 分簽字)
   └─ BU 種子員工

家族干預仍是 SOX 疑點(會計師 review):即使家族「掛名 sponsor」,Big-4 仍可能列「tone-at-the-top deficiency」。所以加 Steering Committee 議事規則 + 會議錄音是必要補丁。

外部顧問獨立性閉環:必須由審計委員會選 + 預算獨立 + 3 年輪換 + 不得轉任公司任何職位,否則 Big-4 視為 management’s specialist 形同虛設。

六、AI Agent Team 編制 + Curator HR 認證

v0.1 寫「BU senior 兼任 Curator 每週 1 小時」,但 HR review 點出實務上 100% 推給課長 / 工程師 — senior 行事曆已被「客訴會、月結、業務檢討、產能調度」塞滿。v0.3 拆角色:

BU Curator(技術骨幹):>8 年資歷工程師,每週 45 分跑 PR review
BU Senior 把關人:senior 主管,每週 15-30 分簽字 + A 級判斷 + 口述補充業務知識

HR 認證制度(避免空文化)

完成 6 個月任期 + brain 達標 → HR 核發「AI 治理認證」
0.5 P-band 加分(等同跨部門輪調)— 但需走集團人才發展委員會核可,IT 處單獨發會被 HR 退件
PBC 5%-10% 權重(集團強制下限 7%,避免 BU 主管壓到 5%)
senior 連 2 週缺席 → 自動升級 CIO,1 個月失能撤銷認證
分初級 / 資深 Curator:資深需 2 年 + 跨 BU 貢獻才核發,避免認證貶值(1-2 年後人人有獎=沒獎)

培訓教材決策(M2 必須定)

8 小時 OWASP Top 10 LLM + ISO 42001 + 公司 brain 規範。中文教材沒現成 — 外購(BSI / SGS 客製課 35-60 萬/梯)vs 內製?M2 前必定。HR LMS(Cornerstone / SuccessFactors / 自建)需要排版上架、考題設計、合格標準 ≥ 80%、補考機制。

七、預算 NTD 4,000-6,000 萬具體 breakdown(CFO 視角)

v0.3「中等到中高」級距完全不能進審計委員會。CFO 真實要的數字:

項目	級距 NTD	備註
CapEx GPU 3-5x H100	1,200-2,000 萬	DGX 整機約 $300K USD/台,5 年攤提 ≈ 250 萬/年
CapEx 多台 4090	200 萬	本地推理 + Layer 2 分類器
OpEx 雲端 LLM Enterprise	1,500-3,000 萬/年	萬人 seat × $40-80/月(Anthropic / Azure / Bedrock)
OpEx ISO 雙標稽核 + 內審準備	200 萬	Schellman / TÜV SÜD / BSI / DNV 任選
OpEx RD x 2 + Curator 折算	600 萬
OpEx SIEM 自架 stack	100-150 萬	OpenSearch + S3 + Glacier vs Splunk 商業版 3,000-8,000 萬,自架降一個量級
OpEx 培訓教材外購	60-100 萬	BSI / SGS 客製課
Year 1 全包	4,000-6,000 萬	這是 CFO 要的具體數字

稅務套利(產創條例 §10-1)

GPU CapEx 認列「智慧機械」可申請 5% 投資抵減營所稅
萬人集團單年 H100 採購 1,500 萬 → 抵減 75 萬
5 年攤提下,財報「壓力」比一次性 OpEx 燒掉小

ROI / Risk-Adjusted Savings(對審計委員會講)

避免 GDPR 罰鍰:營收 4% 上限(萬人製造集團風險:數十億)
避免 ISO 失效訂單損失:B2B 客戶常要求 ISO 認證,失效 = 失客戶
員工生產力:保守 5% × 萬人 × 平均薪資 = 數億效益
對審計委員會用「保險費比喻」,不要堆生產力數字

預算占比 / 排擠效應

萬人製造集團年 IT 預算約營收 0.8-1.5%
AI 治理 4-6 千萬 ≈ IT budget 8-12%
會排擠 ERP 升級 / MES / 製造 IoT — 必須在董事會列「AI 治理 vs 其他 IT 投資」優先序

隱性成本(v0.3 漏)

Layer 2 GPU HPA 4x baseline → 雲端 burst 月結尖峰可能單月燒 30% 預算 → 加 monthly cap
廠商封鎖演練(每年 1 次)→ 計入 BCP 成本
WORM 7 年 audit log 取出費(egress)→ incident 時單次可能數十萬,需準備金

八、Audit Log 三軌制(法庭採信 + 個資合規)

Track	內容	保留	儲存 / 解密
A. Metadata	員工 hash、tool、decision_code、bu_context、token jti	7 年 WORM	OpenSearch 30天 → S3 1年 → Glacier 7年;HSM mapping CISO+法務雙簽
B. 全文 prompt/response	完整對話內容	90 天	OpenSearch 加密分離,90 天自動刪
C. Incident 凍結全文	觸發事件相關全文	7 年 WORM	S3 Object Lock;CISO+法務+內稽三方簽

HSM mapping 雙簽 break-glass 必須留書面審批單(會計師補丁):申請書 + 核准單 + 時戳服務(TWCA)。否則 SOX 404(d) ITGC 證據能力不足。

勞動事件法 § 35(法務補丁):員工有舉證請求權調閱自身 audit log → 加員工查閱 SLA 14 天 + HR 介接窗口。

九、4 輪 AI review 找出的 22 個 cross-confirmed gap

從 28 份 expert opinion 提煉的最重要議題,按 review 階段:

第一輪(v0.1 → v0.2,7 個 expert):結構性問題

Iron Rules 加 embedding / vector / fine-tune 涵蓋(防 OpenAI embedding 破口)
Curator 拆角色(senior + 技術骨幹)
Multi-ERP 不做統一 schema
SAP S/4HANA 工程量 6-9 個月(原估 3-4 嚴重低估)
Token Impersonation 強制(禁用 service account)
三條 Iron Rules 治理路徑(CIO 簽不夠)
Brain PR Scanner + 雙審 + 簽章 commit

第二輪(v0.2 → v0.3):重大治理結構

三道防線正確化(內稽從 Working Group 退出第三線獨立)
家族介入降溫(Steering Committee 季度 sponsor,不掛主席)
WORM 三軌制(metadata 7年 / 全文 90 天 / incident 7 年)
MCP tool schema 欄位級遮罩
iDempiere MSession + cache 分級 + 月結 SLO 例外
Gateway K8s HPA 5-15 pods(不寫死 3)
GPU 容量 3-5x H100 + 區域副本
同意書脫鉤雇用條件
per-BU view scope(不全集團統一最高 A 級)
跨境 geo-routing by 工作地 BU(不 by 國籍)

第四輪(HR + CFO + 會計師)— 進階 gap(只在新 domain 加入後才被發現)

§16 重寫具體 NTD 級距 + 產創條例 §10-1 + ROI(CFO P0)
30 天法律化時程改 90-120 天 + 過渡期免責(會計師 P0)
監督委員會獨立性閉環(內稽行政線雙線報告 + 外部顧問獨立預算 + 3 年輪換)(會計師 P0)
HSM break-glass 留書面審批單 + 時戳(會計師 P0)
bias probe 獨立 validator(自選 = 自評違反 A.6.2.4)(會計師 P0)
工會協商 fallback(HR P0)
HR LMS + 培訓教材外購 / 內製決策(M2 必定)(HR P0)
退休 / 離職 brain 智財 + 錄影同意 SOP(HR P0)
勞動事件法 § 35 員工查閱 SLA 14 天(法務 P0)

關鍵 insight:第四輪 9 個 gap 是前 3 輪沒有任何 expert 點到的 — 這證明 HR / CFO / 外部會計師三個 domain 是真正的盲點。任何 AI 治理藍圖如果沒有這 3 個 domain 獨立 review,等於沒做完。

十、真人 review 接手 — 5 場會議

會議	時長	對象
法律 / 合規 review	2-3 hr	法遵處長 + 外部勞動法律師 + 個資律師 + 工會代表
組織治理 review	2 hr	CIO + 法遵 + 內稽 + 獨立董事 + 審計委員會
財務 review	2 hr	CFO + 財務副總 + 集團 IT 預算負責人
HR review	1.5 hr	HR 處長 + LMS 負責人 + 工會代表
IT / 工程 review	2-3 hr	IT 主管 + RD lead + ERP 顧問
BU 實戰 review	各 1.5 hr	BU senior + 種子員工(各 BU 一場)
ISO 機構 mock audit	半天	Schellman / TÜV SÜD / BSI / DNV 任選

第一次 mock audit 應在 M9(不是 M11),時間夠改正。SOC 2 Type 2 需 6 個月運行證據,M12 才 Stage 1 → SOC 2 Type 2 報告最快 M18+。

十一、Day 1 待確認的 6 件事

三條 Iron Rules 法務 review — BOM 配方、未公告財報、客戶合約合不合法務認知
ERP 現況 — SAP / iDempiere / Oracle / Dynamics / 混合?(影響 30% 工程量)
準 CISO 人選 — IT 主管?資安代表?
種子 BU 候選 — 欽點 1 個營收前三主力 BU(不要等自願)
預算核給 — Year 1 NTD 4-6 千萬具體編列
ISO 稽核機構意向 — Schellman / TÜV SÜD / BSI / DNV 任選一家

十二、給 CIO 的最後三句話

三條 Iron Rules + 90 天法律化 + 鄉村包圍欽點啟動 = Day 1 全部要做的事。

4 輪 AI review + 28 份 expert opinion 找到的 22 個 gap 是骨架。真正的肉、血、溫度,在你接下來那 5 場真人會議。

這份藍圖的價值不是「告訴你答案」,是「告訴你接下來要問哪 5 群真人哪些問題」。

腦子系統 ISO 整合治理框架:6 篇收成 1 個合規可審計藍圖

重點摘要(TL;DR)

把腦子系統前六篇收成合乎 ISO 27001:2022 + ISO 42001:2023 的整合治理框架。雙標準有 ~40% 重疊,已 27001 認證可快 30-40% 取得 42001。
多場景多用戶多工具的統一架構:5 個共用元件(Gateway / 分級表 / Audit log / Curator / KPI Dashboard)+ 4 類工具(Coding Agent / Chat-native / Bridge / Self-service HTML)+ 5 種角色(銷售 / 客服 / 採購 / RD / 管理層)。
鄉村包圍踏實落地的 5 個 Phase Gate:每個階段過渡前要過硬條件,對應 ISO 稽核里程碑。沒過 Gate 不要硬上下一階段。
月度健檢三個關鍵指標:覆蓋率(80%+)、合規 gap 減少率、稽核就緒度。月度報告 ≠ 一次性稽核 — 持續可量測。
稽核準備 90% 自動化:從 git log / Gateway log / Audit DB / Curator review 自動 export,RD 投入時間從 1-2 個月降到 1-2 週。
本文是腦子系統第七篇收尾。前六篇:Why / How / Scale / Tools / ERP / Self-Service。

一、問題重述

腦子系統六篇文章寫完後,有個關鍵問題沒明確收斂:

整套架構合不合 ISO 27001 + ISO 42001?哪些直接合、哪些有 gap?
第三篇的「鄉村包圍」策略講了大方向,但怎麼穩定踏實做完?哪些真實風險會讓計劃流產?
多場景(銷售/客服/RD/管理層)、多用戶(80 人 vs 萬人)、多 AI 工具(Claude Code / OpenCode / QwenPaw / Self-service HTML)— 怎麼用一套框架統一治理?
怎麼確保多方都得到正確、安全、合規、整合的資料?

本文是腦子系統的收尾整合,把前六篇收成可審計、可執行、可量測的治理框架。

二、ISO 範圍界定(事實驗證)

2.1 適用標準三件套

標準	範圍	關鍵內容
ISO 27001:2022	資安管理(ISMS)	Annex A 共 93 controls,4 themes(Organizational 37 / People 8 / Physical 14 / Technological 34)
ISO 42001:2023	AI 管理(AIMS)	Annex A 共 38 AI-specific controls,9 control objectives,Clauses 4-10 結構
ISO 27701	個資管理(PIMS)	針對 GDPR / 個資法,腦子系統的脫敏管道對應這個

2.2 雙標準的重疊與互補

~40% 重疊:Annex A 的 Clauses 4-10 結構大部分一致(Context / Leadership / Planning / Support / Operation / Performance / Improvement),已 27001 認證可快 30-40% 取得 42001([來源])
60% AI-specific:42001 的 Clause 8(Operation)幾乎沒重疊 — AI Risk Treatment / AI System Impact Assessment / AI System Lifecycle / Data Management 都是 27001 沒有的
同樣 3 年認證週期,可整合 audit 降低 disruption

實務建議:先 27001 → 再加 42001。如果並行做,跟同一個認證機構(Schellman / TÜV SÜD / BSI / DNV)約整合稽核,證據文件大量 reuse。

三、六篇文章 × ISO 控制項映射

每一篇對應到具體 ISO 控制項。標 ✅ 是文章已涵蓋,標 ⚠️ 是 gap 需要補。

3.1 ISO 27001:2022 Annex A 對應

Control	名稱	對應篇	狀態
A.5.10	Acceptable use of information	第 1 篇 Iron Rules	✅
A.5.12 / A.5.13	Classification / Labelling of information	第 1 篇 A/B/C 分級	✅
A.5.19-21	Supplier relationship	第 4 篇 OpenClaw 教訓	✅
A.5.34	PII protection	第 2 篇脫敏 pipeline	✅
A.6.3	Awareness, education, training	第 1 篇 Layer 3 規則+教育	✅
A.8.3	Information access restriction	第 5 篇 iDempiere AD_Role	✅
A.8.15	Logging	第 2 篇 Gateway audit log	✅
A.8.20-23	Networks security / Web filtering	第 1 篇 Gateway 流量管制	✅
A.8.28	Secure coding	第 6 篇 LLM 產 HTML 安全規範	⚠️ 部分
A.8.32	Change management	第 2 篇 git PR review	✅
A.5.7	Threat intelligence	未涵蓋	⚠️ Gap
A.5.30	ICT readiness for business continuity	未涵蓋	⚠️ Gap
A.7.x	Physical controls(機房 / 進出管制)	未涵蓋	⚠️ 範圍外

3.2 ISO 42001:2023 Annex A 對應(關鍵 9 個 control objectives)

42001 Annex A 範疇	對應篇	狀態
AI 政策(AI Policy)	第 1 篇 Iron Rules + 第 2 篇 Working Group	✅
AI 風險評估(AI Risk Assessment)	第 2 篇分級表 + 第 4 篇 OpenClaw 廠商風險	✅
AI 系統影響評估(AI Impact Assessment)	第 2 篇 Working Group 跨部門	✅
AI 系統生命週期(AI System Lifecycle)	第 2 篇 Phase 0-5 + 第 4 篇 Harness 修改	✅
資料治理(Data Management)	第 5 篇 iDempiere AD_Role + 分級表	✅
透明度與可解釋(Transparency)	第 4 篇三層漏斗(規則優先,LLM 兜底)	✅
第三方關係(Third-party relationships)	第 4 篇 Enterprise 合約 + DPA	✅
監控與量測(Monitoring & Measurement)	第 2 篇 KPI Dashboard	✅
人為監督(Human Oversight)	第 2 篇 Curator + 第 6 篇預設 read-only	✅
偏見緩解(Bias Mitigation)	未明確涵蓋	⚠️ Gap
事故管理(AI Incident Management)	部分(audit log 可追,但無 SOP)	⚠️ 部分

四、Gap 補強方案

對應前面標 ⚠️ 的條款,給每個 gap 具體補強做法:

4.1 A.5.7 Threat intelligence

定期收集 LLM 廠商安全公告(Anthropic / OpenAI / Microsoft 等)
訂閱 prompt injection / jailbreak / model 漏洞情報源(OWASP Top 10 for LLM Applications)
每季 working group 會議納入「AI 威脅情報」議程,新威脅進腦子的 brain markdown

4.2 A.5.30 ICT readiness for business continuity

Gateway 高可用(HA)+ 失效時的降級策略(本地 LLM 接管)
本地 Ollama 機器是 backup endpoint(雲端 frontier 掛時切回來)
BCM 演練每年 1 次:模擬 Anthropic API 全面斷掉,測員工是否能繼續工作

4.3 A.8.28 Secure coding(LLM 產 HTML)

第 6 篇講的「textContent 不用 innerHTML」、「不用 eval」是 prompt 規範,但需要 server side 驗證
Gateway 端加 HTML scanner:用 ESLint security rules 或 OWASP HTML Sanitizer 掃 LLM 產的 HTML
不通過 scanner 的 HTML 不出 Gateway,改要員工重新 prompt

4.4 ISO 42001 偏見緩解(Bias Mitigation)

定期測試 LLM 對特定 prompt 的回應差異(性別、年齡、地區)
建立 baseline test set:每季用同一組 prompt 測各廠 LLM,看 bias drift
Working Group 評估該 bias 是否影響業務,進腦子 brain markdown 註明

4.5 AI 事故管理(Incident Management)

定義「AI 事故」:LLM 產生危害內容、員工誤洩 A 級資料、Gateway 規則失效、模型 hallucination 造成業務錯誤等
SOP:發現 → 通報 CISO → audit log 凍結 → 影響評估 → 補救 → 事後檢討進 brain
每年至少 1 次 incident 演練(tabletop exercise)

五、鄉村包圍踏實落地的 5 個 Phase Gate

第三篇講了大方向。本節補上「每個 Phase 過渡前的硬條件」,沒過 Gate 不要硬上下一階段。每個 Gate 同時對應 ISO 稽核里程碑。

Gate	時機	硬條件	ISO 對應
G0 啟動	M1 W1	CIO 簽核 3 條集團 Iron Rules + 任命準 CISO	42001 Clause 5 Leadership commitment
G1 種子	M2 結束	至少 2 個 BU 各有 5 人在用、無重大 Iron Rules 違反事件	27001 A.6.3 Awareness 已生效
G2 根據地	M4 結束	至少 2 BU 完成雙 Repo + 分級表 v0.1 + 脫敏字典 + Pre-commit hook	27001 A.5.12-13 + 42001 Data Management
G3 包圍	M6 結束	Working Group v1 集團 CLAUDE.md + 集團分級表 + 三場核心會議全 done	42001 Clause 6 Planning + AI Policy 落地
G4 進城	M9 結束	Gateway 上線、雙引擎接入、KPI Dashboard 跑、北極星比例 > 70%	27001 A.8.x + 42001 Clause 8 Operation
G5 稽核就緒	M12	內部稽核完成、gap 補完、外部稽核機構 walk-through 通過	兩標準 stage 1 audit 通過

5.1 過 Gate 的紀律

G1-G2 沒過,不要進 G3 包圍:沒實戰數據的 Working Group 會回到「法務全判 A 級」失敗模式
G3 沒過,不要急著裝 Gateway:沒分級表的 Gateway 是裝飾,只浪費 RD 時間
G4 沒過,不要排稽核:北極星 < 70% 表示員工沒採用,稽核員問「實際運作」會答不出來

六、多場景統一治理框架

6.1 五個共用元件(全公司一套)

元件	角色	維護方
LLM Gateway	所有 AI 流量必經(LLM call + ERP query)	中央 RD + IT
分級對應表	A/B/C 級資料定義	Working Group 月度 patch
Audit Log	全程紀錄(誰、何時、查什麼)	中央 SIEM
Curator 制度	brain 品質把關 + 過時知識淘汰	每 BU 一名
KPI Dashboard	月度健檢 + 北極星追蹤	中央 RD

6.2 五種角色 × 四類工具的整合矩陣

角色 \ 工具	Coding Agent	Chat-native	Bridge	Self-Service HTML
RD	✅ 主要	輔助	✅ 出差/移動	輔助
銷售	不適用	✅ 主要	不適用	✅ 主要
客服	不適用	✅ 主要	不適用	✅ 主要
採購	不適用	✅ 主要	不適用	✅ 主要
管理層	不適用	輔助	不適用	✅ 主要(儀表板)

關鍵:不同角色用不同工具,但全部走同一個 Gateway。Gateway 那層的分級 / 脫敏 / audit / 路由規則,所有工具共用。

6.3 確保「正確 / 安全 / 合規 / 整合」的四個機制

正確:資料不來自 LLM 幻覺,而是來自 ERP via MCP/Gateway。LLM 只是把 ERP 資料整理 + 渲染,不產生資料
安全:三層縱深 — 員工身分(SSO)、Gateway 規則(分級脫敏)、ERP 角色(AD_Role)
合規:每個元件都對應 ISO 控制項,稽核證據自動 export
整合:Single Source of Truth — 不同部門看到的資料一致(因為都來自同一個 ERP)、不同 AI 工具產的回應背後是同一個 Gateway

七、月度健檢:踏實的可量測指標

7.1 北極星(唯一最重要)

本月 Gateway request 數 ÷ (Gateway + 偵測到的網頁版 LLM 流量)
目標: 90%+
< 70% = 拉力策略失敗,要查為什麼員工繞過

7.2 三個關鍵健檢指標

指標	定義	目標	頻率
覆蓋率	月活使用 Gateway 員工 / 全公司	80%+	月
合規 gap 減少率	本季新發現 gap 數 vs 已修復 gap 數	修復 ≥ 新增	季
稽核就緒度	90% 證據可從系統自動 export	M9 後達標	季

7.3 月度報告(高層用)

不要丟一堆數字給高層,只回答三個問題:

「上個月 X% 員工選擇 Gateway over 網頁版」← 北極星
「員工繞過 Gateway 的 Top 3 原因」← 下個月修哪邊
「ISO 稽核就緒度 + 安全收益 + 雲端費用」← 投資回報

八、稽核準備 90% 自動化

傳統公司 ISO 稽核要花 1-2 個月補資料、做文件、開會。腦子系統的設計讓大部分證據自動產出:

稽核需要的證據	來源	準備時間
AI 政策文件 + 變更歷史	company-brain git log	0(隨時可拉)
分級表執行紀錄	Gateway audit log	0(已存在)
脫敏執行實證	Gateway pipeline log	0(已存在)
員工訓練紀錄	HR 既有訓練系統	既有資料
第三方供應商 DPA	合約管理系統	既有資料
KPI 持續監控	Dashboard	0(自動產生)
變更管理	git PR 紀錄	0(已存在)
事故管理	SIEM ticket 系統	既有系統
人為監督	Curator 月度 review log	0(已存在)

結果:RD 投入稽核準備時間從 1-2 個月降到 1-2 週。準備重點變成「整理 + 解釋」,而不是「補資料」。

九、12 個月時程(對應第三篇 + 本文)

月	關鍵交付	Gate
M1	Iron Rules 三條 + 準 CISO 任命 + 種子 BU 招募	G0
M2	2 BU 種子員工開始用 AI	G1
M3-M4	BU 各自雙 Repo + 分級表 v0.1 + 脫敏字典	G2
M5-M6	Working Group 三場核心會議 + 集團 v1	G3
M7-M9	Gateway 上線 + 雙引擎 + Self-service HTML + iDempiere MCP	G4
M10-M11	Gap 補強 + 內部稽核 + 外部顧問 walk-through	—
M12	ISO 27001 + 42001 stage 1 audit	G5

對 80 人公司:可加速到 6-9 個月。對萬人集團:可能延長到 18 個月,但鄉村包圍策略讓每個 BU 看到自己的進度,而不是等全集團一起。

十、結語:從 6 篇到 1 個治理框架

前六篇是分散的拼圖:Why / How / Scale / Tools / ERP / Self-Service。本篇把它們收成一個整體。

「合不合 ISO」答案是:大部分天然合,有 5 個 gap 要補強。「鄉村包圍怎麼踏實做完」答案是:5 個 Phase Gate + 月度健檢 + 北極星 KPI。「多場景多用戶多工具怎麼統一」答案是:5 個共用元件 + 角色×工具矩陣。

真正讓系統「正確、安全、合規、整合」的不是任何一個元件,是所有元件都會合在 Gateway 那一層:那是員工、AI、ERP、稽核員看的同一個交集點。設計對了,後面都對。

對企業 IT 主管的最後一個具體下一步:

把本文的 ISO 控制項對應表存成 git repo 一份檔,作為日後稽核 SoA(Statement of Applicability)的基礎
下一次 working group 會議,把本文的 5 個 Phase Gate 排進共享日曆
稽核機構初步接洽:Schellman / TÜV SÜD / BSI / DNV 任選一家,問整合 27001 + 42001 報價
北極星 KPI 上 dashboard,讓員工看得到(透明度本身是 ISO 42001 的要求)

可運作的 Reference Links(2026/5 撰文時驗證)

ISO 標準官方

ISO/IEC 27001:2022 官方頁面:https://www.iso.org/standard/27001
ISO/IEC 42001:2023 官方頁面:https://www.iso.org/standard/42001
ISO 42001 explained(官方):iso.org/iso-42001-explained

Annex A 控制項對照(實作指南)

ISO 27001:2022 Annex A 93 controls 完整指南:hightable.io 完整指南
ISO 42001 vs 27001 差異(IT auditor 視角):isauditr.com
ISO 42001 38 controls checklist:knowlee.ai checklist
ISO 42001 lessons from auditing(CSA):CSA 實戰心得

業界實戰

Microsoft 對 ISO 42001 的合規:Microsoft Learn
AWS AI lifecycle risk management with ISO 42001:AWS Security Blog
Schellman ISO 42001 FAQs:schellman.com

OWASP Top 10 for LLM(對應 A.5.7 Threat Intelligence)

OWASP Top 10 for LLM Applications:OWASP 官方

2026 年 5 月 2 日

Chat-native AI Agent + Harness 設計 + OpenClaw 事件:腦子系統工具中性化

重點摘要(TL;DR)

AI 工具有三類完全不同定位:Coding Agent(Claude Code / OpenCode)、Chat-native General-purpose Agent(OpenClaw / QwenPaw / Nanobot)、Bridge(ccbot / 官方 Channels)。前一版混淆了,本篇修正。
OpenClaw 事件(2026/4/4):Anthropic 撤銷 OAuth、訂閱費不再支援第三方工具。對企業最重要的教訓:永遠用 API key 走 Enterprise 合約,不要把員工個人訂閱當公司基建。
OpenClaw 替代品光譜:QwenPaw(對企業 air-gapped 最優)、Nanobot(輕量)、PraisonAI(low-code multi-agent)、Hermes / grip-ai / Chatbox / Enclave AI 等。
Harness 設計(Anthropic 2026/3 三 agent 方法論):Simplicity First / Strip away non-load-bearing / Evaluator 看任務難度。模型升級時主動砍腳手架。
企業整合三版本:A(Claude Code + 官方 Channel)、B(Claude Code + ccbot + Gateway)、C(QwenPaw + Ollama + Gateway 完全 air-gapped)。可同時並存於同一集團不同 BU。
本文是腦子系統四部曲第四篇(Tools 工具中性化),前三篇:Why / How / Scale。

一、修正前篇:三類工具的真實定位

本文重寫前一個版本,因為前版誤把 OpenClaw 當作 OpenCode 處理。實際上這兩個工具完全不同類,分屬不同層的解決方案。整個生態系應該分成三類來看:

類別	代表工具	主要任務	介面	目標用戶
A. Coding Agent	Claude Code、OpenCode、Cursor、Aider、Cline、Codex CLI	寫 code、debug、跨檔案 refactor	Terminal / IDE	RD / DevOps
B. Chat-native General Agent	OpenClaw、QwenPaw、Nanobot、PraisonAI、Hermes	email / 行事曆 / 訂機票 / 表單填寫 / 一般行政自動化	原生支援多 chat app(WhatsApp/Telegram/Slack/Signal/iMessage)	全公司員工(含非 RD)
C. Bridge / Channel	ccbot、Anthropic 官方 Channels、CloudCLI	把 Coding Agent 延伸到行動端	Telegram / Discord / iMessage	RD(出差/移動中)

關鍵 insight:B 類(Chat-native)對「萬人集團 80% 不寫 code 的員工」覆蓋面最大 — 業務、客服、行政、HR 不需要 coding agent,他們要的是 email / 行事曆 / 訂機票 / 表單自動化,而且要從原本就在用的 chat app 直接呼叫。

二、OpenClaw 事件:企業導入的重大警訊

2.1 事件時間軸

2025/11:作者 Peter Steinberger(奧地利開發者)發布 Clawdbot
2026/2/14:作者宣布加入 OpenAI(這個時間點在後續事件中很微妙)
2026/3:Clawdbot 改名 OpenClaw,支援 50+ integrations
2026/4/4:Anthropic 正式撤銷第三方工具的 OAuth 存取,Claude Pro/Max 訂閱不再支援 OpenClaw 等工具(改算 extra usage)
2026/4/10:Anthropic 短暫封鎖作者本人帳號,輿論發酵後恢復

2.2 為什麼被封鎖

Anthropic 的官方說法:違反 Consumer Terms of Service。

Claude.ai 訂閱(Pro / Max)是個人用 — 「for personal use through Anthropic’s own interfaces」
不可 power programmatic workflows(自動化流程、批次處理)
OpenClaw 用 OAuth 把訂閱費當 API 用,實質是「訂閱價跑 API 等級流量」 — Anthropic 形同補貼
Anthropic 法務頁面明寫:「Using OAuth tokens obtained through Claude Free, Pro, or Max accounts in any other product, tool, or service — including the Agent SDK — is not permitted」

2.3 對企業的四個重大教訓

永遠用 API key,不要用個人訂閱 OAuth:員工說「我用我的 Claude Pro 帳號接公司工具」聽起來省錢,實際上隨時被切。企業 AI 基建只能架在 Enterprise 合約 + API key 之上。
「廠商封鎖風險」要納入工具選型:同一家廠商可能因為政策、競爭、法務等原因突然改規則。OpenClaw 的 50 倍成本上漲、不少 OpenAI 第三方工具被封鎖、API rate limit 突調 — 都是真實案例。不要把全公司流量壓在單一廠商。
本地模型 + 開源 chat-native agent 是唯一不被綁的路徑:OpenClaw + Anthropic 訂閱會被切,但 QwenPaw + Ollama + Qwen3-Coder-Next 完全自主,沒有任何第三方可以動你的服務。對 A 級資料 BU 是必選。
合約條款要求「廠商如改政策提前 90 天通知」:Enterprise 合約 negotiate 時,把「policy stability」寫進去。Anthropic 對個人訂閱可以說改就改,但對 Enterprise 客戶通常得提前通知 — 這個條款要爭取。

三、OpenClaw 替代工具完整地圖

OpenClaw 事件後,生態系冒出大量替代品。按企業適用場景分:

3.1 對企業 air-gapped BU 最理想:QwenPaw

來源:agentscope-ai 開源(原名 CoPaw,2026 改名 QwenPaw 強調 Qwen 生態整合)
特色:本地模型優先(Qwen3-Coder-Next、Qwen3.6 等)+ 多 chat app 介面(DingTalk / Feishu / WeChat / Discord / Telegram)
對台灣企業:中文 chat app 支援度最高,適合製造業 / 集團內部
適合:萬人集團 A 級 BU、要完全 air-gapped、製造業 BOM / 財務 / HR

3.2 輕量化:Nanobot

來源:香港大學,4,000 行 Python(對比 OpenClaw 的 430K 行)
支援:Telegram / Discord / WhatsApp / Slack / Email out of the box
適合:小團隊、想完全掌控代碼、不需要 50+ integrations 的企業

3.3 多 agent 編排:PraisonAI

特色:low-code 多 agent 平台,100+ LLM 支援,內建 handoffs / guardrails / memory / RAG
支援:Telegram / Discord / WhatsApp
適合:需要 Anthropic 三 agent harness 設計、但不想自己從頭寫的企業

3.4 其他主流選項

工具	特色	適合
Hermes Agent	self-improving 學習迴圈,從複雜任務生 skill 文件	需要長期累積能力的場景
grip-ai	Claude Agent SDK based,31 tools,826 tests	仍想用 Anthropic 但要可控的開發者
NanoClaw	5 個檔案 vs 430K 行,Linux 容器隔離,WhatsApp focus	資安要求高、要細粒度隔離
Chatbox	統一介面接 ChatGPT / Claude / Gemini / Ollama	員工想跨多家 LLM 的桌面用戶
Enclave AI	iPhone / Mac 完全本地,語音對話	A 級資料行動端、無雲依賴
OpenJarvis	Ollama / vLLM / SGLang / llama.cpp 整合,有 learning loop	已有本地推理基建的企業
Moltworker	Cloudflare 推出的 self-hosted personal agent	已用 Cloudflare 生態的企業

四、Harness 設計方法論

「Harness」(腳手架)是 Anthropic 2026 提出的核心工程概念,指 AI agent 周邊的所有非模型組件:system prompt、memory 機制、tool 定義、context 管理、agent 多步循環、評估迴圈。Anthropic 在 Harness design for long-running application development(2026/3)正式發表了完整方法論。

4.1 Anthropic 三 agent harness

Agent 角色	職責	Handoff 產出
Planner	把模糊的初始 prompt 展開成詳細規格	feature 清單(Anthropic 範例 200+ 條)
Generator	執行核心工作、實作功能、自我評估進度	code + progress tracking artifact
Evaluator / QA	用具體 criteria 獨立評估,抓 generator 漏掉的 gap	合格/不合格 + 具體缺漏清單

三 agent 分離的目的:解決長時間任務的 context overflow。一個 agent 跑 8 小時 context 會爆,三個 agent 用 structured handoff artifact 傳遞狀態,每個 agent 自己 context 重置 — 這就是 Anthropic 講的「maintain coherence across multiple context windows」。

4.2 公司腦子系統如何映射到 Harness

Anthropic Harness 元件	公司腦子系統對應	維護方
System Prompt	global/CLAUDE.md(Iron Rules)	Working Group
Memory(persistent)	公司腦 brain markdown + 個人腦	Curator + 員工自己
Tools / MCP servers	Skills(可重用能力包)+ 內部 RAG	RD + 部門 Curator
Context 管理	build.sh 編譯時依目標 model 過濾	RD
Evaluator agent	Curator 月度 review + KPI Dashboard + ISO 稽核	準 CISO + Curator

4.3 修改 Harness 的三條原則

Simplicity First:找最簡解,需要才增加複雜度。每個 harness 元件都 encode 了一個假設「模型自己做不到 X」 — 這些假設要定期 stress-test。
Strip away non-load-bearing pieces:模型升級時(Opus 4.5 → 4.6 → 4.7),原本必要的腳手架可能變成包袱。Anthropic 觀察 Opus 4.6 比 4.5 需要更少腳手架 — 模型越強,harness 越輕。
Evaluator 看任務難度:「worth the cost when the task sits beyond what the current model does reliably solo」。簡單 CRUD 不需要 evaluator;跨檔案 refactor 才需要。不為對稱加 evaluator,只在它真的攔到問題時保留。

五、行動端通訊三種模式(正確分類)

模式	對應	機制	適合場景
A. Coding Agent + 官方 Channel	Claude Code + 官方 Channels(2026/3/20)	Anthropic 官方 MCP server,連 Telegram/Discord/iMessage	純 Claude Code 用戶、簡單設定
B. Coding Agent + Bridge	Claude Code / OpenCode + ccbot(tmux 之上)	tmux thin layer,讀 pane output、送 keystrokes	RD 想多 session 平行、跨 coding agent
C. Chat-native Agent(Native)	QwenPaw / Nanobot / OpenClaw 等	自帶 agent + 自帶多 chat app,本機跑	全公司員工(含非 RD),日常自動化

關鍵差別:

A 和 B 後面接 Coding Agent(只做 coding 任務的延伸)
C 本身就是 Agent(做廣義自動化:email、行事曆、表單、訂機票)
覆蓋面:A、B 給 RD;C 給全員

5.1 ccbot 機制深入(B 模式代表)

ccbot 是 B 模式主流。技術核心:tmux 之上的 thin control layer,不是 SDK wrapper。

Claude Code 進程原封不動跑在桌機 tmux window
ccbot 監聽 JSONL 轉錄檔(每 2 秒 polling)
Telegram 訊息 → 送 keystrokes 到 tmux pane
terminal output → ccbot 解析後 forward 回 Telegram
1 Telegram topic = 1 tmux window = 1 Claude session

適配到其他 coding agent(OpenCode / Aider / Cline)需要 fork ccbot 改 transcript parser,核心架構不變,1-2 週可做出 v0。

六、企業整合架構:三種模式 × Gateway

6.1 完整流量路徑

員工手機 (WhatsApp / Telegram / Slack / Signal)
    ↓ chat message
┌────────────── 三種入口都進這層 ──────────────┐
│  A: Coding Agent + 官方 Channel              │
│  B: Coding Agent + ccbot Bridge              │
│  C: Chat-native Agent (QwenPaw 等)           │
└────────────────────────────────────────────┘
    ↓ HTTP request 經 BASE_URL 改寫 (關鍵!)
公司 LLM Gateway (LiteLLM + Portkey)
    ├─ Layer 1 regex 脫敏 / 分級
    ├─ Layer 2 小模型 fail-safe
    ├─ 路由 + audit log
    └─ ↓               ↓
       雲端 frontier   本地 Ollama
       (B/C 級,API key) (A 級)

三種模式的共同點:都要把 endpoint 指向公司 Gateway,讓分級 / 脫敏 / audit 都生效。不可以讓員工的 Chat-native Agent 直接連 Anthropic / OpenAI 的 API,即使是 Enterprise 合約也不該繞過 Gateway。

6.2 安全考量(必看)

訊息 channel 也要分級:Telegram / Discord / WhatsApp 訊息會經過第三方伺服器 → 即使 Gateway 端脫敏,訊息已經先到第三方。建議:
- Slack(enterprise)/ Mattermost(self-host)→ B/C 級可
- Signal → B 邊界、C 級可
- Telegram / Discord / WhatsApp → 僅 C 級
- iMessage → 視所在地區法規(歐盟禁、台灣彈性)
- A 級 BU(財務 / HR / BOM 配方 / 法務)禁止任何外部 chat channel,只能 Mattermost self-host
身份驗證:Bridge / Chat-native Agent 必設 ALLOWED_USERS 白名單,綁員工 chat app 帳號;離職立即撤銷
不要用個人訂閱 OAuth:OpenClaw 事件的核心教訓 — 員工說「我用我的 Claude Pro 接公司工具」聽起來省錢,實際上隨時被切;公司基建只能架在 API key + Enterprise 合約

七、企業導入的三個版本

A 基礎版:Claude Code + 官方 Channels

適合:80 人以下、已用 Claude Code、員工以 RD 為主
成本:Anthropic Enterprise 合約 + 官方 Channels 免費
工程量:1 人 1 週設定完成
限制:覆蓋率低(只給寫 code 的人)、A 級資料無法處理

B 開源版:Claude Code + ccbot + 公司 Gateway

適合:80-1000 人、有 RD 維護能力、想多 session 平行
成本:Anthropic Enterprise + ccbot 自架 + 公司 Gateway
工程量:1.5 RD x 2-3 個月
限制:仍綁 Anthropic、覆蓋率仍偏 RD、A 級資料要走 Mattermost self-host

C 完全本地版:QwenPaw + Ollama + 公司 Gateway ⭐

適合:萬人集團、製造 / 金融 / 國防 / 醫療,有 air-gapped 法規要求
成本:QwenPaw 免費 + GPU 機房(中央 1x H100 + 多台 4090)+ Mattermost self-host + 公司 Gateway
工程量:2-3 RD x 4-6 個月
優勢:
- 整套 air-gapped,A 級資料完全可處理
- 不被任何雲端 LLM 廠商鎖死(OpenClaw 事件不會發生在你身上)
- 覆蓋全公司員工(含 80% 不寫 code 的人)
- 支援中文 chat app(QwenPaw 原生支援 DingTalk / Feishu / WeChat)

三個版本可以同時並存於同一集團:RD BU 用 B 版(Claude Code + ccbot)做 coding;業務 / 客服 / 行政用 C 版(QwenPaw)做日常自動化;管理層內部工具用 A 版(官方 Channels)。不同 BU 不同需求,Gateway 是唯一共用層。

八、結語:工具中性化 + 廠商獨立

不應該把員工綁在某個 AI 工具的某個 UI 上,也不應該把公司基建綁在某家廠商的政策善意上。

讓員工選工具(Claude Code / OpenCode / QwenPaw / OpenClaw),選位置(桌機 / 手機 / 平板),選通訊頻道(Telegram / Discord / Signal / Slack / WhatsApp / Mattermost)。公司只負責 Gateway 那層的腦子注入和分級路由。

OpenClaw 事件提醒我們:廠商可以在任何時間用任何理由改規則。本地模型 + 開源工具 + 自有 Gateway 是唯一不會被切的路徑。Bridge 和 Gateway 正交組合,工具汰換不影響腦子系統 — 這才是真正的工具中性化。

同樣道理:模型升級時,Anthropic 教我們「strip away non-load-bearing pieces」。腦子系統的每季健檢就是這個原則的應用。Harness 不是寫一次就完的,是隨模型演化、隨廠商政策變動而調整的活系統。

2026/5 工具與事件參考

OpenClaw 事件:TechCrunch 報導、The Register
Anthropic Channels:官方文件(2026/3/20 發布)
ccbot:six-ddc/ccbot(Telegram ↔ tmux thin bridge)
QwenPaw:agentscope-ai/QwenPaw(本地優先,多 chat app)
Anthropic Harness Engineering:Harness design for long-running application development(2026/3)
Awesome Harness Engineering:ai-boost/awesome-harness-engineering

2026 年 5 月 2 日

標籤: 企業 AI

重點摘要

一、ROI 難算又好算：關鍵在「頻率質變」

二、ROI 要對到戰略本質，不是中階 KPI

三、價值與風險，是一體兩面

四、治理心法：所有人在同一個平台達共識

五、底線：主權 AI

結語：難的不是技術，是人與治理

常見問題 FAQ

怎麼評估 AI 專案的 ROI 才不會低估？

AI 的價值和風險可以分開管嗎？

什麼是主權 AI（Sovereign AI）？

導入企業 AI，最該先想清楚什麼？

📚 本系列：SAP NOW AI Tour 的 4 堂課

重點摘要

一、鋼鐵廠：讓機器狗進 1,200 度的高爐

無人化：機器狗、無人機、無人天車

設備健康指標，就像人的健康指標

二、銀行：把客戶經理變成 AI Agent

三、電子代工：工廠不是實驗場

結語：三個產業，同一個底層邏輯

常見問題 FAQ

AI 怎麼用在設備維護上？

為什麼說「工廠不是實驗場」？

AI 會取代客戶經理或第一線人員嗎？

導入 AI Agent 一開始就會很有效率嗎？

📚 本系列：SAP NOW AI Tour 的 4 堂課

重點摘要

一、先看演進：從 Traditional AI 到 Agentic AI

二、兩個開放協定：MCP 與 A2A

三、實際跨系統流程長怎樣

四、資料層：串接，而不是搬遷

五、官方參考架構：把內外 Agent 安全地串起來

結語：協定先行，骨架才穩

常見問題 FAQ

MCP 和 A2A 有什麼差別？

用 AI Agent 一定要把資料搬上雲嗎？

什麼是 Agentic AI？

MCP 現在可以實際使用了嗎？

📚 本系列：SAP NOW AI Tour 的 4 堂課

重點摘要

一、先承認：80% 的轉型卡在「人與流程」，不是技術

二、四大關鍵核心：人員、流程、應用、數據

三、不能跳步：合理化 → 標準化 → 自動化

四、為什麼「戰情室」做了沒人用

五、把方法論變成步驟：從經營分析到決策機制

結語：轉型是手段，創造價值才是目的

常見問題 FAQ

數位轉型失敗的最主要原因是什麼？

為什麼不能直接導入自動化或 AI？

為什麼很多 BI 戰情室做完就沒人用？

數位化和數位轉型有什麼不同？

📚 本系列：SAP NOW AI Tour 的 4 堂課

重點摘要

一、AI 不是要取代你，而是放大你的價值

二、餐飲業的加薪邏輯：五成四變四成五

三、製造業的跨國解法：集中化加邊緣化

四、整合能力才是護城河

五、平台商的兩個答案：資料留地端、成功靠選擇

問題一：用 AI 一定要把所有資料都搬上雲嗎？

問題二：員工要具備什麼技能、上什麼課才會用？

整場的理論收束：人機協作的三階段

結語：差距落在組織，而不是工具

常見問題 FAQ

企業導入 AI，一定要把資料全部上雲嗎？

員工要會寫程式才能用企業 AI 嗎？

「從自動化到自主化」具體是什麼意思？

跨國企業怎麼把 AI 能力複製到海外廠？

重點摘要

什麼是 monday.com AI Work Platform?

四大 AI 產品線:Sidekick、Agents、Vibe、Notetaker

monday Sidekick — 個人 AI 助理

monday Agents — 自主 AI workforce

monday Vibe — AI 開發工具

monday Notetaker — AI 會議助理

AI 計費:Consumption 點數制,1 點 = $0.01 USD

Vibe Prompt 按模型分級計費

各 Plan 點數方案:Basic 卡很死,Enterprise 強制 25 席起

CASETiFY 實戰案例:5 個 Agent 跑完整業務 lifecycle

4 階段 × 5 個 Agent 接力