跟 AI 寫程式真的需要軟工基礎嗎？

需要，但不是新的軟工，是把舊軟工套到 AI 4 個特性上：訓練資料 cutoff、stateless 無記憶、非 deterministic 輸出、高並發。本文盤點 15 條經典軟工紀律，用一條真實 Opus 4.8 Workflow 實測對話拆解每條的具體用法。

跟 AI 寫程式最重要的 5 條軟工紀律是什麼？

排序：(1) 驗證紀律 — 強制 AI 查資料不要憑記憶；(2) 正交分解 — 拆軸線問不要 bundled question；(3) 文檔作為下個 session 輸入 — 把學到的寫成可被未來 conversation 直接讀的格式；(4) 真實基準 — 用 production codebase 評估，不用 toy example；(5) Focused review — 一次只 review 一條軸線。

什麼是「文檔作為下個 session 輸入」？

傳統軟工的文檔是給未來人類讀者看的（wiki、Notion、ADR）。AI 場景下文檔是給未來 stateless agent 讀的 — 寫成下次 conversation 的 AI 可直接讀懂的格式（例如 brain file、CLAUDE.md、AGENTS.md）。沒這層，每次跟新 conversation 都得從零教一遍。

跟 AI 寫程式的「預算控管」是什麼？

Multi-agent workflow 用 token 是 single-agent 的 3-10×（Anthropic 自己 paper 數據），Research system 是 ~15×。沒設 token budget cap 或 wall-time timeout，AI 寫錯 orchestration script 可能跑出 100 個 agent、$60 cost、20 分鐘 wall-time 不自停。Claude Code admin page 有 hard daily limit 設定，可設預算上限。

AI 預設 fail-silently 是什麼意思？

AI 遇到錯誤的默認行為是「生看起來合理的內容掩蓋失敗」，而不是 raise exception。例如 workflow synthesis agent 算錯總數 83 vs 真實 109，它會「完整交付」一份其實內部有 hole 的報告。對抗方法：在 prompt 裡明寫「如果 X 條件不符，標 INVALID 而不是瞎掰」，並設計獨立 verification step 主動 cross-check。

跟 AI 寫程式為什麼 senior eng 才做得好？

跟 AI 寫程式，code 是 AI 生的，你扮演 reviewer + verifier + spec writer 三個角色 — 傳統上叫 PM / QA / Tech Lead，都是 senior eng 的活。「跟 AI 寫程式比較簡單」完全反了 — 它把 senior eng 的工作 commoditize 到每個用 AI 的人身上。本文 15 條的本質就是把這三層活的紀律寫下來。

腦子系統合不合 ISO 27001 + ISO 42001?

大部分天然合,但有 5 個 gap 需要補強:A.5.7 威脅情報、A.5.30 業務持續性、A.8.28 secure coding(LLM 產 HTML)、ISO 42001 偏見緩解、AI 事故管理 SOP。具體做法:訂閱 OWASP Top 10 for LLM、Gateway HA + 本地 Ollama backup、HTML scanner、定期 bias baseline test、incident playbook 演練。已 27001 認證可快 30-40% 取得 42001。

鄉村包圍策略怎麼穩定踏實做完?

5 個 Phase Gate(每個過渡前要過硬條件):G0 啟動(CIO 簽 Iron Rules + 任命準 CISO)、G1 種子(2 BU 各 5 人在用)、G2 根據地(雙 Repo + 分級表 v0.1)、G3 包圍(集團 CLAUDE.md v1)、G4 進城(Gateway + 北極星 70%)、G5 稽核就緒(內審完成)。沒過 Gate 不要硬上下一階段,每個 Gate 對應 ISO 稽核里程碑。

多場景多用戶多工具怎麼用一套框架統一?

5 個共用元件:LLM Gateway(全公司共用)、分級對應表(Working Group 維護)、Audit Log(中央 SIEM)、Curator 制度(每 BU 一名)、KPI Dashboard(中央 RD)。5 種角色 × 4 類工具的矩陣:RD 主用 Coding Agent + Bridge,銷售/客服/採購主用 Chat-native + Self-service HTML,管理層主用 Self-service HTML 儀表板。不同角色不同工具,但全部走同一個 Gateway。

怎麼確保多方都得到正確、安全、合規、整合的資料?

四個機制:正確 — 資料來自 ERP via MCP/Gateway,LLM 不產生資料只整理渲染。安全 — 三層縱深(SSO + Gateway 規則 + iDempiere AD_Role)。合規 — 每個元件對應 ISO 控制項,稽核證據自動 export。整合 — Single Source of Truth,不同部門看到一致資料(都來自同一 ERP)、不同 AI 工具回應背後是同一 Gateway。

ISO 稽核準備要花多久?

傳統公司 1-2 個月補資料、做文件、開會。腦子系統設計讓 90% 證據自動產出:政策 git log、執行紀錄 Gateway audit log、脫敏實證 pipeline log、變更管理 PR 紀錄、KPI Dashboard、Curator review、訓練紀錄、合約 DPA。RD 投入時間降到 1-2 週,重點變成『整理+解釋』而不是『補資料』。

為什麼是純靜態 HTML 而不是 web app?

三個理由:(1)零安裝零部署,銷售拿到 HTML 雙擊就能開,不需要 IT 部署任何東西;(2)可分享、可離線存證,HTML 檔案本身就是「快照 + 可重新整理」;(3)個人化客製,每個員工每次需求不同,LLM 即時產生比 IT 寫一個固定 web app 彈性大十倍。Web app 適合「跨日重複使用且結構固定」的工具,self-contained HTML 適合「臨時客製、看一下、開會秀」的場景。

HTML 怎麼安全地對接 ERP?直連 iDempiere REST 嗎?

不要直連。HTML 一定要透過公司 Gateway proxy。理由:(1)iDempiere 不該暴露在 internet,Gateway 才是受控邊界;(2)HTML 不能放 token / API key,但 SSO cookies 透過 Gateway 自動帶進去更安全;(3)Gateway 統一管 CORS、rate limit、audit log、OData filter 校驗,避免每個服務重複設定。第二篇文章設計的 LLM Gateway 在這裡只要多開一條 ERP proxy 路徑即可。

LLM 產的 HTML 會不會有 XSS 漏洞?

會,所以 prompt 必須強制規範:(1)用 textContent 不用 innerHTML;(2)不用 eval()、Function();(3)Chart.js / Tailwind 從固定 CDN 載,版本鎖定;(4)資料插入用 DOM API 不字串拼接 HTML。再加一層 server side 校驗:Gateway 收到 HTML 產生請求時可以做 sanitization。但實務上 LLM 跟著規範 prompt 寫,XSS 風險可控,主要威脅是 OData filter injection,在 Gateway 層校驗即可。

員工權限怎麼控?銷售會不會看到 CFO 的資料?

不會。權限完全由 iDempiere AD_Role 處理:Gateway 帶員工 SSO 身份進入,iDempiere 看到請求帶 SalesRep Tom 的 token,自動套 Tom 的角色限制,只回傳 Tom 角色能看的資料。LLM、Gateway、HTML 三端都不需要重新設計權限。這是 iDempiere 30 年累積的角色控制直接拿來用,比自己寫 ABAC 簡單一個量級。

v0 最低成本多久能上線?

1 RD x 1-2 週可做出 v0:Telegram bot 接收 query、一個固定 system prompt、Gateway 開一條 read-only proxy 到 iDempiere C_Order table。先讓 5-10 個業務試用,收回饋。v1(2-4 週)加多 chat app + prompt template 庫 + audit log。v2(4-8 週)加寫入支援 + cache + 分享機制。對中小企業 v0 可能就夠用 80%。

為什麼要把 iDempiere 包成 MCP server?

因為 MCP 是 2026 年 AI 應用連接外部資料的開源標準協議,Anthropic / OpenAI / Microsoft 都採納。一次寫好 MCP server 就能讓 Claude Desktop / Claude Code / Cursor / VS Code / ChatGPT 同時用,不用為每個 AI 工具寫一遍。對 ERP 整合特別關鍵 — 員工從任何 chat 工具都能查訂單、跑 process、生報表,不用自己打開 ERP 點選單。

iDempiere REST 跟 OData 是什麼關係?

iDempiere 透過 bxservice/idempiere-rest 這個 plugin 提供 REST API,其中 api/v1/models/{table} 端點支援 OData filter 語法($filter, $top, $orderby 等)。OData 是 Microsoft 主導的 RESTful 資料查詢標準,iDempiere 的 model API 採用了 OData 過濾語意。注意 iDempiere 用 'neq' 不是 'ne'。

Microsoft 的 Dynamics 365 ERP MCP server 怎麼借鏡?

Microsoft 三分類 Data tools / Form tools / Action tools 剛好對應 iDempiere REST 的 api/v1/models / api/v1/windows / api/v1/processes 三個端點。借鏡的關鍵設計:(1)動態 context 根據 user 角色決定 agent 看到什麼;(2)Allowed MCP Clients 白名單,不是誰都能接;(3)權限不重複設計,直接用 ERP 內建 role-based access control。

iDempiere + MCP 比 Dynamics 365 ERP MCP 好在哪?

對中小規模製造業、要 air-gapped 法規場景、預算有限:iDempiere GPLv2 開源、可 self-host、A 級資料完全本地處理、tool call 沒額外計費。Dynamics 365 是訂閱 + Copilot 點數計費(0.1 Credits per tool call),只能 Cloud,A 級資料受限。但 Dynamics 365 的 MCP 設計成熟度更高,值得借鏡架構。

從 0 到上線需要多久?

漸進式三階段:v0 Read-only Data Tools(2-4 週,1 RD)用本文 Python 範例;v1 加 Action Tools(再 2-4 週)支援 Process call、create/update;v2 Form Tools + Window 互動(4-8 週)支援複雜流程。對中小企業 v0 可能就夠用 80%。對中大型集團 12-16 週完整版可上線。

分類: 開發集成

跟 AI 寫程式的 15 條軟工紀律 — 用一條真實對話從頭拆解

重點摘要

常聽到「跟 AI 寫程式需要軟工基礎」,但具體是哪些?本文用前一篇 Opus 4.8 Workflow 實測那條真實對話從頭拆,對照 15 條經典軟工紀律。
盤點結果:做到 9 條 / 部分做到 1 條 / 沒做 5 條。每條都有對話證據引用,沒做的給可執行 action。
15 條按高 leverage 排序前 5 名:驗證紀律、正交分解、真實基準、focused review、文檔作為下個 session 輸入。這 5 條沒守,其他都白搭。
結論:跟 AI 寫程式需要的不是「新的軟工」,而是把舊軟工套到 stateless / non-deterministic / 訓練截止 / 高並發 4 個 AI 特性上的對應方法。

為什麼問這題

「跟 AI 寫程式需要軟工基礎」這句話傳得很廣,但講細節的人少。多數人講出來的不是軟工,是 prompt engineering tricks(怎麼下 prompt、怎麼用 chain-of-thought)— 那叫 LLM 使用技巧,不叫軟工。

真正的軟工基礎是從 1970 年代 SWEBOK 累積到今天的工程紀律:specification、verification、separation of concerns、observability 那些。問題是這些紀律最初是針對「人寫 code、人 review、人交接」設計的,套到「AI 寫 code、人 review」會不會失效?哪些反而更重要?

本文不假設,用一條真實對話實證:5/29 我跟 Claude Opus 4.8 跑 Home123 backend 的 109 個 GraphQL resolver authz pattern audit 對照實驗,從頭到尾大約 8 輪對話、~50 分鐘。把這條對話拆解,對照 15 條經典軟工紀律,看真實場景下到底用到了哪些、漏了哪些。

15 條紀律的分類框架

從經典軟工教材(《Code Complete》、《Pragmatic Programmer》、SWEBOK Guide)抽出 15 條跟 AI 協作最相關的紀律,分 4 群:

類別	條目	經典 reference
核心驗證	#1 驗證紀律、#13 根因分析、#7 回顧	TDD / Postmortem culture / Code Complete §22
設計分解	#2 正交分解、#8 規格先於實作、#9 權衡分析、#14 錯誤處理哲學	Dijkstra SoC / Spec-first / Pragmatic Programmer Ch.4
過程紀律	#3 真實基準、#5 focused review、#6 並行執行、#10 預設驗收標準、#12 預算控管	Performance Engineering / Code Review SOP / Agile
知識持久化	#4 文檔作為輸入、#11 可重跑、#15 版本控制	ADR / Reproducible Research / Git workflow

下面逐條拆。每條格式統一:定義 → 經典出處 → 你做了沒 → 證據或補救 → 對 AI 協作的特別意義。

#1 驗證紀律 (Verification Discipline)

定義:任何宣稱(claim)都要靠可重現的證據才能信。
經典出處:Steve McConnell《Code Complete》§22 The Twelve-Step Programming Process、TDD 的 Red-Green-Refactor 第一步、Cynefin framework 的 probe-sense-respond。

本次對話做了沒:✅ 做了,多次。

對話證據:

「幫我讀書 https://www.anthropic.com/news/claude-opus-4-8」
→ 不接受 AI 憑記憶,要 AI 去 web 抓。

「今天已經是5/29了你的日期有問題」
→ 即時校正環境假設,不讓我繼續用錯日期。

「我正在運作你看一下」
→ 不接受我講的文字總結,要看 ps / pstree / jsonl 真實 OS 訊號。

對 AI 協作的特別意義:AI 的訓練資料有 cutoff(我的是 2026 年 1 月)。你問跟 cutoff 之後的事(Opus 4.8 是 5/28 發佈),我用「記憶」回答就是瞎掰 — 而且會用流暢的口氣瞎掰,不像人類會猶豫。強制 AI 查資料這個動作,等於把 AI 從「自信的 LLM」拉回「會用工具的執行者」。這條 baseline 沒守,後面 14 條全變空談,因為起手第一個 claim 就錯了。

#2 正交分解 (Separation of Concerns)

定義:一個議題只談一個軸線,軸線之間不混。
經典出處:Dijkstra 1974《On the role of scientific thought》、Parnas 1972 information hiding、UNIX philosophy 的 “do one thing well”。

本次對話做了沒:✅ 做了,而且是教科書級。

對話證據:

「首先看起來除了MODEL 還有 EFFORT
同樣是SONNET 還可以有HIGH XHIGH?
WORKFLOW 我要怎麼去用?」

三個正交軸線(Model / Effort / Workflow)分開問。對照組是新手會問「給我最好的設定」— 等於要 AI 替你在多維空間做加總決策,你拿到答案也不知道為什麼。

對 AI 協作的特別意義:AI 處理 bundled question 會發生兩種失敗:(1) 只回最顯眼那條,其他偷偷漏掉;(2) 強行給一個整合答案,但每個軸線都妥協。你下意識把 3 軸拆開,等於逼 AI 逐個 expose,你才能照自己的 context 做選擇。這對應的軟工原則是「不讓抽象漏掉」(don’t leak the abstraction)的反向應用:你拒絕 AI 把抽象漏掉。

#3 真實基準 (Representative Benchmarks)

定義:評估新工具用真實場景,不用 toy example。
經典出處:John Hennessy / David Patterson《Computer Architecture》§1.8 Fallacies and Pitfalls(benchmark 永遠騙人)、SPEC CPU 為什麼要 update、ML 領域 distribution shift 一整條研究線。

本次對話做了沒:✅ 做了,而且是本次對話最關鍵的一個動作。

對話證據:

「好你現在用HOME123 專案做一個測試循環然後用你的WORKFLOW試試看記錄下來差異」

不要 toy 不要 hello-world,直接拿 Home123 的 109 個 production resolver。這個動作直接決定了實驗結論的可信度。

對 AI 協作的特別意義:80% 的「新 AI 工具評測」文章用合成 case(leetcode-style problems),結論毫無遷移性。Anthropic 自家 4.8 release notes 用的也是 SWE-bench、Terminal-Bench 這種「合成的真實」 — 不是任何一家公司的 production codebase。你直接拿 109 個 real resolver 來測,workflow 暴露出來的問題(主 orchestrator 抓到 synthesis agent 算錯 83 vs 109)在合成 case 上看不到,因為合成 case 沒那麼大、catch 不到 emergent behavior。這個動作的工程價值比你的 prompt 內容更高。

#4 文檔作為下個 Session 輸入 (Documentation as Next-Session Input)

定義:寫文件不是給未來的人看,是給未來的 stateless agent 看,作為下次 conversation 的可讀輸入。
經典出處:Architecture Decision Records (ADR, Michael Nygard 2011)、SREbook 的 runbook 文化、Reproducible Research 運動(Donald Knuth literate programming 的延伸)。

本次對話做了沒:✅ 做了,而且是主動做。

對話證據:

「Ab然後我想請你發一篇文章到wordpress上詳細比對這一次的經驗跟數據還有該怎麼啟用的prompt」

同時要求三份產出:(A) brain/dynamic-workflows.md(下個 conversation 我會自動讀)、(B) 更新 brain/adaptive-agent-team-staffing.md(舊文件補新知識)、(WordPress 文章 —對人類讀者跟搜尋引擎)。

對 AI 協作的特別意義:你跟人類同事的會議結論寫成 wiki/Notion,下次他翻過。跟 AI 寫 code 的對話結論寫成 brain file,下次 conversation 的 AI 把它當 first-class context 讀 — 等於把這次 conversation 的腦容量無損傳給下次。一般軟工人甚至沒聽過這個用法(「文件是給 AI 讀的?」),但它是 LLM 時代的 ADR + retrospective 文化合體。沒這層,你每次跟新 conversation 都得從零教一遍,等於每次都 onboarding。

#5 Focused Review (一次只 review 一條軸線)

定義:給 code review 的 feedback 一次只挑一條軸線改,不混雜其他要求。
經典出處:Google Engineering Practices《Code Review Developer Guide》、《The Art of Readable Code》Ch.15、Andy Hunt《Pragmatic Thinking and Learning》Ch.9。

本次對話做了沒:✅ 做了,而且 6 個字精準命中。

對話證據:

「注意好讀性跟比較方式」

6 個字,2 條軸線,沒夾雜其他要求(沒同時挑錯字、補內容、改標題)。我回去重做的時候不需要 disambiguate「我到底該優先處理哪一條」。新手 reviewer 會給 30 條 mixed feedback,作者改完反而亂七八糟。

對 AI 協作的特別意義:AI 在 mixed feedback 下會做兩件事:(1) 試圖一次解決所有,結果每條都打折;(2) 自選優先序,但你看不到它怎麼選的。你的 focused feedback 等於把「review reviewer」這層 meta-loop 去掉。對 token 成本也直接有差 — AI 不用先花 token 解析「Tom 到底想我先處理哪條」,直接動工。

#6 並行/異步執行 (Async Parallel Execution)

定義:能並行的工作不要序列化等待,結果到再收。
經典出處:Concurrent programming 整個學門、Amdahl’s law、async/await 在現代語言的普及、Toyota production system 的並行工序設計。

本次對話做了沒:✅ 做了。

對話證據:

「我正在運作你看一下」

你開另一個 terminal 跑 workflow,沒等我講完就行動。我這邊主 session 同時讀你的 process tree + session jsonl 做即時觀察。兩條軌道平行,中間用 jsonl 落地通訊。

對 AI 協作的特別意義:跟 AI 對話有個隱形成本叫 cache miss penalty。Claude 的 prompt cache 5 分鐘 TTL,超過就要從零重讀整個 conversation。如果你序列化等(我講完→你看→你跑→等結果→回我),很容易 5 分鐘外。並行化 + 中間用 file system / jsonl 落地通訊,等於把 cache 維持在熱狀態。傳統軟工這條對應的是「不要 block 在 IO 等待」,AI 場景下是「不要 block 在對話等待」。

#7 回顧 (Retrospective)

定義:任務完成後不直接進下一個,先回看「what went well / what didn’t」。
經典出處:Agile retrospective(Scrum 每個 sprint 末必做)、Norm Kerth《Project Retrospectives》、Etsy/Google 的 blameless postmortem 文化。

本次對話做了沒:✅ 做了,而且是 meta 級 — 你問本篇這題就是 retrospective。

對話證據:

「還有很多人說跟ai寫作需要很多的軟工基礎，不像請你評估一下所謂的軟工基礎在我們所有的循環裡面，我無形中有用到哪一些…因為有一些是我打中很關鍵的點，而你不知道那些是不是軟工基礎」

這句話本身是回顧:你不滿足於「拿到結果就走」,還要拆解過程、識別 pattern、產生可遷移知識。

對 AI 協作的特別意義:AI 不會主動 retrospect — 我跑完就等下一個 prompt,沒人觸發我不會自己回頭看「剛剛這條對話我做對了什麼」。retrospective 必須由你發起。但 retrospective 的產出對 AI 特別有價值:它是 #4 文檔作為輸入的最佳 raw material — 直接把回顧結論寫成 brain file,下次 conversation 直接用。傳統 retrospective 是「同個團隊下個 sprint 用」,AI 場景是「同個你下個 conversation 用」。

#8 規格先於實作 (Spec-First / Specification before Implementation)

定義:動手寫 code 之前先把「要做什麼」「驗收標準」寫死。
經典出處:Leslie Lamport《Specifying Systems》、TDD「先寫測試」也是這條的變形、Design by Contract (Bertrand Meyer)、SDD(Spec-Driven Development)的學派。

本次對話做了沒:✅ 做了,而且是顯式的 4 維度規格。

對話證據:

「記錄下來差異怎麼啟動有優化那些地方要做什麼東西必要是什麼」

4 個維度寫死:(1) 啟動方式、(2) 優化點、(3) 要做的東西、(4) 必要條件。我後續的 brain file 跟 WordPress 文章兩份產出,結構直接照這 4 維度生。

對 AI 協作的特別意義:沒給 spec 的 AI 會「自由發揮」,結果是形式上看起來有結構,實際結構是 AI 替你做的選擇,你不一定買單。你給 4 維度等於把結構決定權拿回來,AI 只負責填內容。這條對應的傳統軟工是 PRD/RFC,AI 場景是「在 prompt 裡內嵌驗收 schema」。

#9 權衡分析 (Trade-off Analysis)

定義:任何方案都有 cost 跟 benefit,要顯式列出再比較。
經典出處:Software Architecture 教材必有的 ATAM (Architecture Tradeoff Analysis Method)、Jeff Bezos 的「two-way door / one-way door decisions」、《Pragmatic Programmer》Ch.4「Be a Catalyst for Change」的反向。

本次對話做了沒:✅ 做了,而且是顯式追問。

對話證據:本系列你連續問了三個 trade-off 問題:

「差異你可以跑跑看」(empirical 比較 cost)

「我想知道Workflow那一個，他現在到底對我的意義是什麼？我看不太出來」(質疑單一方向的 benefit)

「注意好讀性跟比較方式」(cost = 讀者認知負擔 vs benefit = 完整性)

對 AI 協作的特別意義:AI 對「該不該做某件事」的默認是 yes — 因為訓練資料裡的「Yes, you should」遠多於「No, don’t」。你「我看不太出來意義」這句逼我從 advocacy 模式切到 honest assessment 模式,實際結論變成「不存它,寫 reference 進 brain 就好」。這條對應的傳統軟工是 design review 裡「這個複雜度真的需要嗎?」的提問。

#10 預設驗收標準 (Acceptance Criteria Upfront)

定義:任務開始前先寫死「做到什麼程度算 done」。
經典出處:Agile user story 的 INVEST criteria、Behavior-Driven Development (BDD) 的 Given-When-Then、Definition of Done 是 Scrum 必備產物。

本次對話做了沒:🟡 部分做到。

分析:你 #8 給了 4 維度規格,算是 partial acceptance criteria。但缺了「品質門檻」:

workflow 跑出來的 report 要達到什麼分類正確率才算可信?
baseline 跟 workflow 的差異要大到多少才算「值得換 workflow」?
對話拆解後若 15 條都做到,實質工程效率提升多少才算夠?

結果就是 — workflow 抓到 12 個 hand-roll,我們默認接受這個數字,沒去 sample 5 個函式人工驗證。如果 workflow 系統性把某類 hybrid 全錯標,我們不會發現。

該怎麼補:任務開始前加一句「驗收標準」段落。例如本次該寫:

驗收標準:
1. 兩邊跑完後,我會手動 sample 5 個 USES_PRELUDE 跟 3 個 HAND_ROLLED 對證據
2. 如果 baseline 跟 workflow 在這 8 個樣本上有 2 個以上分歧,需逐個澄清
3. 完整 109 函式都要有 row,缺一個視為失敗

對 AI 協作的特別意義:AI 沒驗收標準會「看起來完成」(plausible-looking output),但內部可能 systematically 錯。傳統軟工裡 acceptance test 是另一個人寫的,AI 場景下你得自己寫,因為 AI 不會主動跟自己對抗。本次沒守這條的代價:我們得花一篇文章解釋「為什麼信任 workflow 的結果」,而本來只需要 sample-test。

#11 可重跑 / Idempotency (Reproducible Execution)

定義:任何過程要可從頭重來,輸入相同則輸出相同(在合理隨機範圍內)。
經典出處:Make / build system 整個學門、Donald Knuth literate programming、Reproducible Research 運動、Docker / IaC 的根本動機。

本次對話做了沒:❌ 沒做。最具體的證據是你沒按 s 把 workflow script 存下來。

分析:本次跑了 11 個 Haiku 4.5 平行 audit,產生 146 行 JavaScript orchestration script,結果只存在 session 暫存目錄。如果這次的審計結論被人質疑(例如「12 個 hand_roll 是真的還是 AI 瞎標」),你要重跑驗證沒辦法保證跑出同一份結果 — 因為:

下次跑 Claude 會重新生 script,chunk 切法可能不同
Haiku 4.5 即使 temperature 0 也有非 deterministic 因素(MoE routing 隨機)
Cache hit 率不同 → 提示空間不同 → 細節結論不同

該怎麼補:三層防護(從便宜到昂貴):

最低: 把 script 從 session 暫存目錄 cp 出來歸檔到 brain 或 repo
中等: 把 script 真的存成 ~/.claude/workflows/<name>.js slash command,雖然本案大概不重跑,但其他 audit 可以 fork
高保證: 把 audit 結論 + 109 函式分類存成 JSON / CSV,用 schema 驗證,以後重跑只需 diff JSON 不需要重看 markdown

對 AI 協作的特別意義:AI 的輸出有內建非 determinism(temperature、MoE、context order),這跟傳統 reproducibility 假設(同 input → 同 output)直接衝突。AI 場景的可重跑不能依賴「程式邏輯一樣」,要依賴「中間結果落地」 + 「結果用結構化格式儲存」 + 「下游 verifier 用同 schema 驗」。傳統軟工這條是「build 可重現」,AI 場景是「結論可驗證」。

#12 預算控管 (Cost / Budget Cap)

定義:任何運算工作開始前先設天花板,超過自動停。
經典出處:Cloud computing 的 budget alerts、Kubernetes resource limits、Hadoop / Spark 的 timeout、Stripe 的「circuit breaker」pattern、SREbook §12 effective troubleshooting 的 budget 章節。

本次對話做了沒:❌ 沒做。

分析:我們跑 workflow 的時候沒設 token budget 或 wall-time cap。實際跑了 11 個 agent、~$6.10 estimated cost、132 秒 wall-time。如果 Claude 寫的 script bug 了 — 例如把 chunk 切成 100 個,可能跑出 100 個 agent、$60 cost、20 分鐘 wall-time。沒任何機制自動阻擋。

該怎麼補:

prompt 裡明寫上限 — 例如「最多派 12 個 agent,單一 agent 最多跑 60 秒」
用 --effort medium 而不是 high 開始,確認 quality 夠才升 effort
跑前先讓 Claude 估算 token cost 跟 agent 數,你 approve 才放跑(workflow 內建這層 approval prompt,但你按 [3] View raw script 之前沒人問你 budget)
對自己設「單條對話 spend 上限」(例如 $10),透過 Claude Code admin page 或 API budget API 強制

對 AI 協作的特別意義:傳統軟工 budget 是「機器跑爛要錢」,AI 場景下 budget 還包含「AI 寫錯 script 跑很久才發現」的 fail-loud delay。Anthropic 自己在他們 multi-agent research system 的 paper 也警告:multi-agent 用 token 是 single-agent 的 3-10×,Research system 是 ~15×。沒 budget cap 等於放任這個倍率,3am 一覺起來收到 $200 帳單是真實風險。

#13 根因分析 (Root Cause Analysis)

定義:遇到問題不停在表象,挖到「為什麼會發生」的最底層。
經典出處:Toyota 的「Five Whys」、Apollo 13 事故報告、Etsy / Google 的 blameless postmortem template、《The Field Guide to Understanding Human Error》。

本次對話做了沒:🟡 部分做到,但是 AI 替你做的。

分析:本次 audit 最有價值的發現是「guard role 被 AuthzDecision.IsCommunityWide 排除,迫使 5 個 resolver 各自重 probe 一段相同 SQL」。這是根因分析的成果 — 不停在「這幾個 resolver 沒用 prelude」,而是挖到「為什麼它們不能用」。

但這是 workflow 的 synthesis agent 替你做的,不是你做的。Baseline 模式下 1 個 agent 沒做出這層,你也沒主動追問「為什麼會有 5 個重複」。如果這次跑 baseline 你會 miss 這個 root cause。

該怎麼補:不能只靠 AI 替你做。可以加紀律 — 拿到分類結果後,主動問:

看到 12 個 HAND_ROLLED,我們 ladder 5 個 why:
- 為什麼這 12 個沒用 prelude? → 各自原因
- 為什麼它們有共同原因? → 找 pattern
- 為什麼這個 pattern 沒被早發現? → 流程 gap
- 為什麼流程沒抓到? → tooling gap
- 為什麼 tooling 沒設計這層? → 設計時的假設

對 AI 協作的特別意義:AI 默認停在第一層觀察(「這幾個沒用 prelude」)。要挖根因得明確要求(「列出 root cause」)或結構性逼它(workflow 的獨立 synthesis pass 就是設計來做這個)。傳統軟工這條是 debug 工具,AI 場景是「prompt design」工具 — 在 prompt 裡內嵌 root cause analysis instruction,或設計獨立 verification agent。

#14 錯誤處理哲學 (Error Handling Philosophy)

定義:對「事情會出錯」這件事有明確設計姿態 — fail-fast vs fail-silently、retry policy、circuit breaker、graceful degradation。
經典出處:Erlang 的「let it crash」哲學、《Release It!》Michael Nygard 整本書、Google SREbook §22 addressing cascading failures。

本次對話做了沒:❌ 沒做。

分析:我們沒任何「workflow 跑到一半失敗了怎麼辦」的計畫:

如果某個 chunk 的 Haiku agent 超時了 → 我們沒設 retry 也沒設 fallback
如果 synthesis agent 算術錯了(這次真的發生了:83 vs 109)→ 我們沒設 verification 步驟,純靠主 orchestrator 主動懷疑
如果 JSON schema 驗證 fail → 不知道會發生什麼,沒測過
如果 workflow runtime 自己 crash → 沒 graceful resume 流程

該怎麼補:在 prompt 裡加 error handling instruction:

如果跑到一半發現:
- 某 chunk 的 agent fail → 標記 SKIPPED,繼續其他,最後 report 哪些 skip
- synthesis 結果跟 row count 對不上 → 不要直接出 report,先 escalate 給主 orchestrator 重算
- JSON schema 違反 → 該 row 標 INVALID,繼續其他
- 整體執行超過 5 分鐘 → 自動 abort,出階段性 report

最後 final report 要明確標示哪些 chunk 是「完整跑完」、哪些是「skipped」、哪些是「fail-and-retried」。

對 AI 協作的特別意義:AI 預設 fail-silently — 它會生「看起來合理」的內容掩蓋失敗。傳統軟工 fail-fast 是「raise exception 停下來」,AI 場景的 fail-fast 是「標註 INVALID / SKIPPED 而不是瞎掰」。沒設計這條,AI 會「完整交付」一份其實內部有 hole 的報告,你看不出來。本次 workflow synthesis 算 83 是僥倖被主 orchestrator 抓到,如果主 orchestrator 也沒抓,我們就拿錯誤數字寫文章了。

#15 版本控制紀律 (Version Control Discipline)

定義:任何重要 artifact 進 git,commit message 寫清楚 why,branch 策略對應 workflow。
經典出處:Git 整個工具、Conventional Commits 規範、Trunk-based / GitFlow / GitHub Flow 各家 branch 策略、Linus 的 git 設計初衷。

本次對話做了沒:❌ 沒做。本次產出全部沒進 git。

分析:這次產出了 4 件 artifact:

~/.claude/projects/-home-tom/memory/brain/dynamic-workflows.md(新建)
~/.claude/projects/-home-tom/memory/brain/adaptive-agent-team-staffing.md(編輯)
~/.claude/projects/-home-tom/memory/MEMORY.md(編輯)
WordPress 文章兩篇

前三個位置實際是 ~/.claude/projects/-home-tom/ — 你有可能沒把它放在 git 控管下,意思是:

brain 編輯沒 commit history,半年後想知道「dynamic-workflows.md 是什麼時候加的、為什麼加」沒記錄
如果 brain 不小心被改錯了(例如未來某個 conversation AI 寫壞了),無法 rollback
跨機器同步只能靠 rsync / cloud sync,沒 conflict resolution

該怎麼補:

cd ~/.claude/projects/-home-tom && git init(如果還沒)
新 brain 或重大編輯後 commit:git add brain/ MEMORY.md && git commit -m "feat(brain): dynamic-workflows from 2026-05-29 Opus 4.8 test"
WordPress 文章 export markdown 進專屬 repo,或用 wp-cli 串自動 backup
workflow script 改 #11 補救時順便 commit 進 dotfiles repo

對 AI 協作的特別意義:AI 跨 conversation 是 stateless,brain file 是它的「外部記憶」。外部記憶的版本控管比 code 的還重要,因為你不會看到自己過去 conversation 改了哪些 brain,只有 git diff 告訴你。本次對話我改了 3 個 brain 檔,如果你沒 git 控管,3 個月後你不會記得這幾條條目是 5/29 對話加的還是更早。傳統 git 是 code 的時間機,AI 場景是「我跟 AI 集體記憶的時間機」。

15 條全表:做了沒 × leverage

#	紀律	類別	本次	Leverage(高→低)
1	驗證紀律	核心驗證	✅	★★★★★ 沒守等於沒救
2	正交分解	設計分解	✅	★★★★★ AI 回答品質直接相關
3	真實基準	過程紀律	✅	★★★★★ 結論可信度核心
4	文檔作為輸入	知識持久化	✅	★★★★★ AI 時代特有的紀律
5	Focused review	過程紀律	✅	★★★★ AI 對 mixed feedback 表現差
6	並行執行	過程紀律	✅	★★★ 規模大才顯效
7	回顧	核心驗證	✅	★★★★ 跟 #4 配對 leverage 最大
8	規格先於實作	設計分解	✅	★★★★ 直接決定 AI 輸出結構
9	權衡分析	設計分解	✅	★★★★ 抗 AI 默認 yes 傾向
10	預設驗收標準	過程紀律	🟡	★★★★ 該補,沒守會默認 plausible-looking
11	可重跑	知識持久化	❌	★★★ 任務一次性可省,系統性任務必須
12	預算控管	過程紀律	❌	★★★ 小任務可省,長 background 任務必須
13	根因分析	核心驗證	🟡	★★★★ 主要靠 prompt 設計
14	錯誤處理哲學	設計分解	❌	★★★★ AI 預設 fail-silently 必補
15	版本控制	知識持久化	❌	★★★ brain 控管比 code 控管更重要

結論:跟 AI 寫程式需要哪些軟工?

不是新的軟工,是舊軟工套到 AI 4 個特性上

15 條全部都不是「AI 時代發明的」 — 每條都能在 1990 年代的軟工教材找到根。差別在 4 個 AI 特性對這些紀律的需求強度不同:

AI 特性	被放大需求的紀律
訓練資料 cutoff	#1 驗證紀律(逼 AI 查資料,不要憑記憶)
Stateless / 無 conversation 記憶	#4 文檔作為輸入、#15 版本控制(外部記憶持久化)
非 deterministic 輸出	#11 可重跑、#10 預設驗收標準、#14 錯誤處理(處理隨機性)
高並發 + 高速	#6 並行、#12 預算控管(token 倍率風險)

個人 leverage 排序(5 強)

如果你是這條光譜中段的人(寫過 5 年以上 code,剛開始系統性用 AI 寫 code),最該優先吸收這 5 條:

#1 驗證紀律 — 沒守這條,後面 14 條都白學。AI 講什麼都不能信,grep / curl / test 重驗
#2 正交分解 — 拆軸線問,不要 bundled question。直接決定 AI 回答品質
#4 文檔作為輸入 — 把學到的寫成下個 conversation 可讀的格式。沒這條,每次 onboarding
#3 真實基準 — Toy example 騙人。用 production codebase 評估工具
#5 Focused review — 給 AI feedback 一次只挑一條軸線

沒做的 5 條,該怎麼補

本次對話沒做的紀律對應 5 條 action(從便宜到貴):

#15 版本控制(5 分鐘):cd ~/.claude/projects/-home-tom && git init && git add . && git commit -m "snapshot" 一次性處理
#11 可重跑(2 分鐘):把 workflow script 從 session 暫存 cp 到 brain 或 dotfiles repo 歸檔
#10 驗收標準(每任務多寫 3 行 prompt):任務 prompt 開頭加「驗收標準:N 個項目,M% 正確率,通不過要告訴我」
#14 錯誤處理(每 workflow 多寫 5 行):script 內加 fail-fast / skip / retry 分支
#12 預算控管(系統性設定):Claude Code admin page 設 hard daily limit 或寫個 hook 跑前先估

真正的 meta-insight

本文 15 條展開後最反直覺的觀察:跟 AI 寫程式需要的軟工基礎,大部分不是 code-level 的,是 process-level + protocol-level 的。傳統軟工新人學的順序是「先學語言 → 再學 design pattern → 最後學 process」,跟 AI 寫程式得反過來:先學 process discipline(怎麼下指令、怎麼驗證、怎麼回顧),最後才是 code-level technique。

因為跟 AI 寫程式,code 是 AI 生的,你扮演的是 reviewer + verifier + spec writer 三個角色。這三個角色傳統上叫 PM / QA / Tech Lead — 都是 senior eng 的活。所以「跟 AI 寫程式比較簡單」這句話完全反了 — 它把senior eng 的工作 commoditize 到每個用 AI 的人身上,reviewer 的紀律從「資深工程師的特權」變成「每個 prompt 作者的基本技能」。

這就是為什麼那麼多人「用 AI 寫了一堆 code 但跑不起來」 — 不是 AI 不行,是沒人替他們做 reviewer / verifier / spec writer 那三層活。本文 15 條的本質就是把這三層活的紀律寫下來。

跟我之前文章的關聯

Claude Code Dynamic Workflows 實測:Opus 4.8 + 11 Haiku 平行 audit 109 個 resolver — 本文的 raw material 對話那條
AI 不該替我打 🟢🟡🔴:從 decision-server 看跟 LLM 協作決策的介面方法論 — 本文 #9 權衡分析的延伸實作
跟 AI 寫程式的紀律:6 條規矩讓 AI 從 21 輪修不完到自走嚴格測試 — 本文 #10 驗收標準的歷史版本
從 4 條原則到動態大腦:兩種 Claude Code 知識系統的差異 — 本文 #4 文檔作為輸入的設計哲學討論
「未驗即不可信」AI 協作開發走出 21 輪修不完:SDD/TDD/腦子整合 — 本文 #1 驗證紀律的更早期實踐

2026 年 5 月 29 日

腦子系統 ISO 整合治理框架:6 篇收成 1 個合規可審計藍圖

重點摘要(TL;DR)

把腦子系統前六篇收成合乎 ISO 27001:2022 + ISO 42001:2023 的整合治理框架。雙標準有 ~40% 重疊,已 27001 認證可快 30-40% 取得 42001。
多場景多用戶多工具的統一架構:5 個共用元件(Gateway / 分級表 / Audit log / Curator / KPI Dashboard)+ 4 類工具(Coding Agent / Chat-native / Bridge / Self-service HTML)+ 5 種角色(銷售 / 客服 / 採購 / RD / 管理層)。
鄉村包圍踏實落地的 5 個 Phase Gate:每個階段過渡前要過硬條件,對應 ISO 稽核里程碑。沒過 Gate 不要硬上下一階段。
月度健檢三個關鍵指標:覆蓋率(80%+)、合規 gap 減少率、稽核就緒度。月度報告 ≠ 一次性稽核 — 持續可量測。
稽核準備 90% 自動化:從 git log / Gateway log / Audit DB / Curator review 自動 export,RD 投入時間從 1-2 個月降到 1-2 週。
本文是腦子系統第七篇收尾。前六篇:Why / How / Scale / Tools / ERP / Self-Service。

一、問題重述

腦子系統六篇文章寫完後,有個關鍵問題沒明確收斂:

整套架構合不合 ISO 27001 + ISO 42001?哪些直接合、哪些有 gap?
第三篇的「鄉村包圍」策略講了大方向,但怎麼穩定踏實做完?哪些真實風險會讓計劃流產?
多場景(銷售/客服/RD/管理層)、多用戶(80 人 vs 萬人)、多 AI 工具(Claude Code / OpenCode / QwenPaw / Self-service HTML)— 怎麼用一套框架統一治理?
怎麼確保多方都得到正確、安全、合規、整合的資料?

本文是腦子系統的收尾整合,把前六篇收成可審計、可執行、可量測的治理框架。

二、ISO 範圍界定(事實驗證)

2.1 適用標準三件套

標準	範圍	關鍵內容
ISO 27001:2022	資安管理(ISMS)	Annex A 共 93 controls,4 themes(Organizational 37 / People 8 / Physical 14 / Technological 34)
ISO 42001:2023	AI 管理(AIMS)	Annex A 共 38 AI-specific controls,9 control objectives,Clauses 4-10 結構
ISO 27701	個資管理(PIMS)	針對 GDPR / 個資法,腦子系統的脫敏管道對應這個

2.2 雙標準的重疊與互補

~40% 重疊:Annex A 的 Clauses 4-10 結構大部分一致(Context / Leadership / Planning / Support / Operation / Performance / Improvement),已 27001 認證可快 30-40% 取得 42001([來源])
60% AI-specific:42001 的 Clause 8(Operation)幾乎沒重疊 — AI Risk Treatment / AI System Impact Assessment / AI System Lifecycle / Data Management 都是 27001 沒有的
同樣 3 年認證週期,可整合 audit 降低 disruption

實務建議:先 27001 → 再加 42001。如果並行做,跟同一個認證機構(Schellman / TÜV SÜD / BSI / DNV)約整合稽核,證據文件大量 reuse。

三、六篇文章 × ISO 控制項映射

每一篇對應到具體 ISO 控制項。標 ✅ 是文章已涵蓋,標 ⚠️ 是 gap 需要補。

3.1 ISO 27001:2022 Annex A 對應

Control	名稱	對應篇	狀態
A.5.10	Acceptable use of information	第 1 篇 Iron Rules	✅
A.5.12 / A.5.13	Classification / Labelling of information	第 1 篇 A/B/C 分級	✅
A.5.19-21	Supplier relationship	第 4 篇 OpenClaw 教訓	✅
A.5.34	PII protection	第 2 篇脫敏 pipeline	✅
A.6.3	Awareness, education, training	第 1 篇 Layer 3 規則+教育	✅
A.8.3	Information access restriction	第 5 篇 iDempiere AD_Role	✅
A.8.15	Logging	第 2 篇 Gateway audit log	✅
A.8.20-23	Networks security / Web filtering	第 1 篇 Gateway 流量管制	✅
A.8.28	Secure coding	第 6 篇 LLM 產 HTML 安全規範	⚠️ 部分
A.8.32	Change management	第 2 篇 git PR review	✅
A.5.7	Threat intelligence	未涵蓋	⚠️ Gap
A.5.30	ICT readiness for business continuity	未涵蓋	⚠️ Gap
A.7.x	Physical controls(機房 / 進出管制)	未涵蓋	⚠️ 範圍外

3.2 ISO 42001:2023 Annex A 對應(關鍵 9 個 control objectives)

42001 Annex A 範疇	對應篇	狀態
AI 政策(AI Policy)	第 1 篇 Iron Rules + 第 2 篇 Working Group	✅
AI 風險評估(AI Risk Assessment)	第 2 篇分級表 + 第 4 篇 OpenClaw 廠商風險	✅
AI 系統影響評估(AI Impact Assessment)	第 2 篇 Working Group 跨部門	✅
AI 系統生命週期(AI System Lifecycle)	第 2 篇 Phase 0-5 + 第 4 篇 Harness 修改	✅
資料治理(Data Management)	第 5 篇 iDempiere AD_Role + 分級表	✅
透明度與可解釋(Transparency)	第 4 篇三層漏斗(規則優先,LLM 兜底)	✅
第三方關係(Third-party relationships)	第 4 篇 Enterprise 合約 + DPA	✅
監控與量測(Monitoring & Measurement)	第 2 篇 KPI Dashboard	✅
人為監督(Human Oversight)	第 2 篇 Curator + 第 6 篇預設 read-only	✅
偏見緩解(Bias Mitigation)	未明確涵蓋	⚠️ Gap
事故管理(AI Incident Management)	部分(audit log 可追,但無 SOP)	⚠️ 部分

四、Gap 補強方案

對應前面標 ⚠️ 的條款,給每個 gap 具體補強做法:

4.1 A.5.7 Threat intelligence

定期收集 LLM 廠商安全公告(Anthropic / OpenAI / Microsoft 等)
訂閱 prompt injection / jailbreak / model 漏洞情報源(OWASP Top 10 for LLM Applications)
每季 working group 會議納入「AI 威脅情報」議程,新威脅進腦子的 brain markdown

4.2 A.5.30 ICT readiness for business continuity

Gateway 高可用(HA)+ 失效時的降級策略(本地 LLM 接管)
本地 Ollama 機器是 backup endpoint(雲端 frontier 掛時切回來)
BCM 演練每年 1 次:模擬 Anthropic API 全面斷掉,測員工是否能繼續工作

4.3 A.8.28 Secure coding(LLM 產 HTML)

第 6 篇講的「textContent 不用 innerHTML」、「不用 eval」是 prompt 規範,但需要 server side 驗證
Gateway 端加 HTML scanner:用 ESLint security rules 或 OWASP HTML Sanitizer 掃 LLM 產的 HTML
不通過 scanner 的 HTML 不出 Gateway,改要員工重新 prompt

4.4 ISO 42001 偏見緩解(Bias Mitigation)

定期測試 LLM 對特定 prompt 的回應差異(性別、年齡、地區)
建立 baseline test set:每季用同一組 prompt 測各廠 LLM,看 bias drift
Working Group 評估該 bias 是否影響業務,進腦子 brain markdown 註明

4.5 AI 事故管理(Incident Management)

定義「AI 事故」:LLM 產生危害內容、員工誤洩 A 級資料、Gateway 規則失效、模型 hallucination 造成業務錯誤等
SOP:發現 → 通報 CISO → audit log 凍結 → 影響評估 → 補救 → 事後檢討進 brain
每年至少 1 次 incident 演練(tabletop exercise)

五、鄉村包圍踏實落地的 5 個 Phase Gate

第三篇講了大方向。本節補上「每個 Phase 過渡前的硬條件」,沒過 Gate 不要硬上下一階段。每個 Gate 同時對應 ISO 稽核里程碑。

Gate	時機	硬條件	ISO 對應
G0 啟動	M1 W1	CIO 簽核 3 條集團 Iron Rules + 任命準 CISO	42001 Clause 5 Leadership commitment
G1 種子	M2 結束	至少 2 個 BU 各有 5 人在用、無重大 Iron Rules 違反事件	27001 A.6.3 Awareness 已生效
G2 根據地	M4 結束	至少 2 BU 完成雙 Repo + 分級表 v0.1 + 脫敏字典 + Pre-commit hook	27001 A.5.12-13 + 42001 Data Management
G3 包圍	M6 結束	Working Group v1 集團 CLAUDE.md + 集團分級表 + 三場核心會議全 done	42001 Clause 6 Planning + AI Policy 落地
G4 進城	M9 結束	Gateway 上線、雙引擎接入、KPI Dashboard 跑、北極星比例 > 70%	27001 A.8.x + 42001 Clause 8 Operation
G5 稽核就緒	M12	內部稽核完成、gap 補完、外部稽核機構 walk-through 通過	兩標準 stage 1 audit 通過

5.1 過 Gate 的紀律

G1-G2 沒過,不要進 G3 包圍:沒實戰數據的 Working Group 會回到「法務全判 A 級」失敗模式
G3 沒過,不要急著裝 Gateway:沒分級表的 Gateway 是裝飾,只浪費 RD 時間
G4 沒過,不要排稽核:北極星 < 70% 表示員工沒採用,稽核員問「實際運作」會答不出來

六、多場景統一治理框架

6.1 五個共用元件(全公司一套)

元件	角色	維護方
LLM Gateway	所有 AI 流量必經(LLM call + ERP query)	中央 RD + IT
分級對應表	A/B/C 級資料定義	Working Group 月度 patch
Audit Log	全程紀錄(誰、何時、查什麼)	中央 SIEM
Curator 制度	brain 品質把關 + 過時知識淘汰	每 BU 一名
KPI Dashboard	月度健檢 + 北極星追蹤	中央 RD

6.2 五種角色 × 四類工具的整合矩陣

角色 \ 工具	Coding Agent	Chat-native	Bridge	Self-Service HTML
RD	✅ 主要	輔助	✅ 出差/移動	輔助
銷售	不適用	✅ 主要	不適用	✅ 主要
客服	不適用	✅ 主要	不適用	✅ 主要
採購	不適用	✅ 主要	不適用	✅ 主要
管理層	不適用	輔助	不適用	✅ 主要(儀表板)

關鍵:不同角色用不同工具,但全部走同一個 Gateway。Gateway 那層的分級 / 脫敏 / audit / 路由規則,所有工具共用。

6.3 確保「正確 / 安全 / 合規 / 整合」的四個機制

正確:資料不來自 LLM 幻覺,而是來自 ERP via MCP/Gateway。LLM 只是把 ERP 資料整理 + 渲染,不產生資料
安全:三層縱深 — 員工身分(SSO)、Gateway 規則(分級脫敏)、ERP 角色(AD_Role)
合規:每個元件都對應 ISO 控制項,稽核證據自動 export
整合:Single Source of Truth — 不同部門看到的資料一致(因為都來自同一個 ERP)、不同 AI 工具產的回應背後是同一個 Gateway

七、月度健檢:踏實的可量測指標

7.1 北極星(唯一最重要)

本月 Gateway request 數 ÷ (Gateway + 偵測到的網頁版 LLM 流量)
目標: 90%+
< 70% = 拉力策略失敗,要查為什麼員工繞過

7.2 三個關鍵健檢指標

指標	定義	目標	頻率
覆蓋率	月活使用 Gateway 員工 / 全公司	80%+	月
合規 gap 減少率	本季新發現 gap 數 vs 已修復 gap 數	修復 ≥ 新增	季
稽核就緒度	90% 證據可從系統自動 export	M9 後達標	季

7.3 月度報告(高層用)

不要丟一堆數字給高層,只回答三個問題:

「上個月 X% 員工選擇 Gateway over 網頁版」← 北極星
「員工繞過 Gateway 的 Top 3 原因」← 下個月修哪邊
「ISO 稽核就緒度 + 安全收益 + 雲端費用」← 投資回報

八、稽核準備 90% 自動化

傳統公司 ISO 稽核要花 1-2 個月補資料、做文件、開會。腦子系統的設計讓大部分證據自動產出:

稽核需要的證據	來源	準備時間
AI 政策文件 + 變更歷史	company-brain git log	0(隨時可拉)
分級表執行紀錄	Gateway audit log	0(已存在)
脫敏執行實證	Gateway pipeline log	0(已存在)
員工訓練紀錄	HR 既有訓練系統	既有資料
第三方供應商 DPA	合約管理系統	既有資料
KPI 持續監控	Dashboard	0(自動產生)
變更管理	git PR 紀錄	0(已存在)
事故管理	SIEM ticket 系統	既有系統
人為監督	Curator 月度 review log	0(已存在)

結果:RD 投入稽核準備時間從 1-2 個月降到 1-2 週。準備重點變成「整理 + 解釋」,而不是「補資料」。

九、12 個月時程(對應第三篇 + 本文)

月	關鍵交付	Gate
M1	Iron Rules 三條 + 準 CISO 任命 + 種子 BU 招募	G0
M2	2 BU 種子員工開始用 AI	G1
M3-M4	BU 各自雙 Repo + 分級表 v0.1 + 脫敏字典	G2
M5-M6	Working Group 三場核心會議 + 集團 v1	G3
M7-M9	Gateway 上線 + 雙引擎 + Self-service HTML + iDempiere MCP	G4
M10-M11	Gap 補強 + 內部稽核 + 外部顧問 walk-through	—
M12	ISO 27001 + 42001 stage 1 audit	G5

對 80 人公司:可加速到 6-9 個月。對萬人集團:可能延長到 18 個月,但鄉村包圍策略讓每個 BU 看到自己的進度,而不是等全集團一起。

十、結語:從 6 篇到 1 個治理框架

前六篇是分散的拼圖:Why / How / Scale / Tools / ERP / Self-Service。本篇把它們收成一個整體。

「合不合 ISO」答案是:大部分天然合,有 5 個 gap 要補強。「鄉村包圍怎麼踏實做完」答案是:5 個 Phase Gate + 月度健檢 + 北極星 KPI。「多場景多用戶多工具怎麼統一」答案是:5 個共用元件 + 角色×工具矩陣。

真正讓系統「正確、安全、合規、整合」的不是任何一個元件,是所有元件都會合在 Gateway 那一層:那是員工、AI、ERP、稽核員看的同一個交集點。設計對了,後面都對。

對企業 IT 主管的最後一個具體下一步:

把本文的 ISO 控制項對應表存成 git repo 一份檔,作為日後稽核 SoA(Statement of Applicability)的基礎
下一次 working group 會議,把本文的 5 個 Phase Gate 排進共享日曆
稽核機構初步接洽:Schellman / TÜV SÜD / BSI / DNV 任選一家,問整合 27001 + 42001 報價
北極星 KPI 上 dashboard,讓員工看得到(透明度本身是 ISO 42001 的要求)

可運作的 Reference Links(2026/5 撰文時驗證)

ISO 標準官方

ISO/IEC 27001:2022 官方頁面:https://www.iso.org/standard/27001
ISO/IEC 42001:2023 官方頁面:https://www.iso.org/standard/42001
ISO 42001 explained(官方):iso.org/iso-42001-explained

Annex A 控制項對照(實作指南)

ISO 27001:2022 Annex A 93 controls 完整指南:hightable.io 完整指南
ISO 42001 vs 27001 差異(IT auditor 視角):isauditr.com
ISO 42001 38 controls checklist:knowlee.ai checklist
ISO 42001 lessons from auditing(CSA):CSA 實戰心得

業界實戰

Microsoft 對 ISO 42001 的合規:Microsoft Learn
AWS AI lifecycle risk management with ISO 42001:AWS Security Blog
Schellman ISO 42001 FAQs:schellman.com

OWASP Top 10 for LLM(對應 A.5.7 Threat Intelligence)

OWASP Top 10 for LLM Applications:OWASP 官方

2026 年 5 月 2 日

給銷售的 AI 工具:LLM 產自助 HTML × ERP CRUD × 即時資訊圖

重點摘要(TL;DR)

銷售/業務人員在 Telegram 一句話「幫我畫上週每個客戶訂單金額長條圖」 → LLM 30 秒產出 self-contained HTML 檔案 → 員工瀏覽器點開 → 看到即時圖表。
HTML 是 standalone 純靜態,從 CDN 載 Chart.js + Tailwind,內含 JS 透過公司 Gateway 對接 iDempiere REST(不直連 ERP)。
四層架構:Generation(LLM 產)/ Execution(瀏覽器跑)/ Data(Gateway proxy)/ Rendering(Chart.js 渲染)。
混合模式:LLM 產 HTML 時 inline 一份預載資料(打開立即顯示),HTML 內按「重新整理」可主動 fetch 最新值。速度和即時性兼得。
安全設計:HTML 不含 secrets、Gateway 認 SSO、LLM 產的 HTML 用 textContent 防 XSS、Gateway 校驗 OData filter 防 injection、員工只看到 AD_Role 允許的資料。
本文是腦子系統的第六篇,前五篇:Why / How / Scale / Tools / ERP。

一、使用情境

銷售 Tom 在通勤路上滑手機,腦子裡想到「**等等開會要秀上週業績**」。

傳統流程(沒有這個工具)

到公司打開電腦
登入 ERP
找到訂單視窗
篩選日期
匯出 Excel
用 PowerPoint / Excel 畫圖
合計花 30-60 分鐘

新流程(本文設計)

Telegram 對 bot 說:「上週每個客戶訂單金額長條圖」
30 秒後 bot 回 HTML 檔(或連結)
點開,圖表立刻渲染
開會時直接全螢幕秀
合計花 30 秒

關鍵:銷售不需要學任何工具、不需要安裝 app、不需要 IT 部署任何東西。產出的 HTML 還可以分享給同事、存證、離線重看。

二、四層架構

銷售 Tom (Telegram chat)
   ↓
[Generation 層] LLM 看公司腦 + 員工 prompt
   ↓ 產 self-contained HTML
HTML 檔案 (Chart.js + Tailwind 從 CDN 載)
   ↓ Tom 在瀏覽器打開
[Execution 層] 瀏覽器跑 HTML 內 JS
   ↓ JS 對 https://gateway.example.com/erp/query 發 fetch
[Data 層] 公司 Gateway (LiteLLM + Portkey + 自製 ERP proxy)
   ↓ Gateway 帶 Tom 的 SSO 身份
   ↓ 呼叫 iDempiere MCP server / REST API
   ↓ iDempiere AD_Role 自動過濾資料
   ↓ 回 JSON
HTML 內 JS 接到 JSON
   ↓
[Rendering 層] Chart.js 渲染圖表 / 動態表格 / 資訊圖

四層各自的職責清晰、可獨立替換:

Generation:換 LLM(Claude/GPT/本地 Qwen)不影響其他層
Execution:瀏覽器標準環境,任何裝置都能跑(Mac / Windows / iPhone Safari)
Data:Gateway 換成內部 service mesh、ERP 換成另一套都不影響 HTML
Rendering:換 Chart.js 為 ECharts / Plotly 只改前端,後端不動

三、混合模式:預載 + 即時刷新

LLM 產生 HTML 時面對一個取捨:

模式	優點	缺點
A 純 inline:LLM 把資料寫死進 HTML	簡單、離線可看、無 CORS	資料是快照,要新查就要重新產
B 純 fetch:HTML 啟動才查	每次最新	打開時白屏 1-2 秒、需連線
C 混合(推薦):預載 + 重新整理按鈕	立即顯示 + 隨時更新 + 離線可看快照	HTML 較大(包含初始資料)

實務上 C 混合模式最佳。實作:LLM 在產 HTML 時順便呼叫一次 Gateway 拿初始資料,把 JSON 寫進 HTML 的 const initialData = [...],同時保留 refresh() 函數讓員工按按鈕主動更新。

四、LLM 怎麼產 HTML — Prompt 設計

給 LLM 的 system prompt 要包含五件事:

HTML 模板骨架:固定的 head / body 結構,用哪個 CDN 圖表庫
Gateway URL 與 API schema:fetch 要打哪、payload 格式
可用 ERP table 與欄位:從公司腦讀(C_Order / C_BPartner / M_Product 等的可查欄位)
OData filter 語法:eq/neq/gt/contains 等(注意 iDempiere 用 neq 不是 ne)
安全規範:用 textContent 不用 innerHTML、不要 hardcode token、不要 eval()

4.1 System Prompt 範例(精簡版)

You are a HTML dashboard generator for sales staff.

CONTEXT (from company brain):
- Available ERP tables: C_Order, C_BPartner, M_Product, M_InOut
- Common columns for C_Order: GrandTotal, DateOrdered, C_BPartner_ID, IsSOTrx
- Filter syntax: OData (use 'neq' not 'ne')
- Gateway endpoint: https://gateway.example.com/erp/query
- Gateway auth: SSO cookies (credentials: 'include')

OUTPUT REQUIREMENTS:
1. Generate ONE complete self-contained HTML file
2. Use Chart.js via CDN (https://cdn.jsdelivr.net/npm/chart.js)
3. Use Tailwind via CDN (https://cdn.tailwindcss.com)
4. Include initial data inline (call Gateway once and embed JSON)
5. Provide a refresh() function for live update
6. Use textContent (NEVER innerHTML) when displaying data
7. Add a loading spinner during fetch
8. Style: clean, presentation-ready (用得上開會秀客戶)

USER QUERY: {{user_message}}

五、產出 HTML 範例(完整可執行)

下面是 LLM 看到「上週每個客戶訂單金額長條圖」這個 query 後產出的範例 HTML。這是真實可執行的 self-contained 檔案:

<!DOCTYPE html>
<html lang="zh-Hant">
<head>
<meta charset="utf-8">
<title>上週訂單金額(by 客戶)</title>
<script src="https://cdn.jsdelivr.net/npm/chart.js"></script>
<script src="https://cdn.tailwindcss.com"></script>
</head>
<body class="bg-slate-50 p-6 font-sans">

<div class="max-w-4xl mx-auto">
  <div class="flex items-center justify-between mb-4">
    <h1 class="text-2xl font-bold">上週訂單金額(by 客戶)</h1>
    <button id="refreshBtn"
            class="bg-blue-600 text-white px-4 py-2 rounded hover:bg-blue-700">
      🔄 重新整理
    </button>
  </div>
  <p id="meta" class="text-sm text-slate-500 mb-4"></p>
  <canvas id="chart" height="120"></canvas>
  <table class="mt-6 w-full text-sm">
    <thead class="bg-slate-200">
      <tr><th class="text-left p-2">客戶</th><th class="text-right p-2">訂單數</th><th class="text-right p-2">金額</th></tr>
    </thead>
    <tbody id="tableBody"></tbody>
  </table>
</div>

<script>
// === 預載資料(LLM 產生時 inline 進來) ===
const initialData = [
  {customer: "客戶 A", orderCount: 5, amount: 1280000},
  {customer: "客戶 B", orderCount: 3, amount: 850000},
  {customer: "客戶 C", orderCount: 7, amount: 2100000},
  {customer: "客戶 D", orderCount: 2, amount: 420000}
];
const generatedAt = "2026-05-02 09:30";

// === Gateway 設定 ===
const GATEWAY_URL = "https://gateway.example.com/erp/query";
const QUERY = {
  table: "C_Order",
  filter: "DateOrdered ge '2026-04-25' and DateOrdered le '2026-05-01'",
  groupBy: "C_BPartner_ID",
  aggregate: ["count", "sum(GrandTotal)"]
};

// === 渲染函數 ===
let chart;
function render(data, ts) {
  // 注意:用 textContent 不用 innerHTML 防 XSS
  document.getElementById('meta').textContent = `資料時間:${ts}`;

  const tbody = document.getElementById('tableBody');
  tbody.textContent = '';
  data.forEach(row => {
    const tr = document.createElement('tr');
    tr.className = 'border-b';
    [row.customer, row.orderCount, row.amount.toLocaleString()].forEach((v, i) => {
      const td = document.createElement('td');
      td.className = i === 0 ? 'p-2' : 'p-2 text-right';
      td.textContent = v;
      tr.appendChild(td);
    });
    tbody.appendChild(tr);
  });

  if (chart) chart.destroy();
  chart = new Chart(document.getElementById('chart'), {
    type: 'bar',
    data: {
      labels: data.map(d => d.customer),
      datasets: [{
        label: '訂單金額(NTD)',
        data: data.map(d => d.amount),
        backgroundColor: 'rgba(59, 130, 246, 0.6)'
      }]
    },
    options: {
      responsive: true,
      plugins: {legend: {display: false}}
    }
  });
}

// === 即時刷新 ===
async function refresh() {
  const btn = document.getElementById('refreshBtn');
  btn.disabled = true;
  btn.textContent = '⏳ 載入中...';
  try {
    const r = await fetch(GATEWAY_URL, {
      method: 'POST',
      credentials: 'include',  // 帶 SSO cookies
      headers: {'Content-Type': 'application/json'},
      body: JSON.stringify(QUERY)
    });
    if (!r.ok) throw new Error(`Gateway error ${r.status}`);
    const data = await r.json();
    render(data.rows, new Date().toLocaleString('zh-TW'));
  } catch (e) {
    alert('刷新失敗:' + e.message);
  } finally {
    btn.disabled = false;
    btn.textContent = '🔄 重新整理';
  }
}

// === 初始化 ===
document.getElementById('refreshBtn').addEventListener('click', refresh);
render(initialData, generatedAt);
</script>

</body>
</html>

這個檔案存成 orders.html,雙擊即可在瀏覽器打開。打開時看到預載資料(已渲染圖表 + 表格);按「重新整理」就 fetch 最新資料。整個檔案約 80 行,包含全部 logic。

六、安全設計(必看)

6.1 HTML 端

❌ 絕不在 HTML 寫 token / API key:HTML 是員工拿到的檔案,寫 token 等於洩漏。所有認證在 Gateway server side
✅ 用 fetch(..., {credentials: 'include'}) 帶員工 SSO cookies
✅ 渲染用 textContent,不用 innerHTML(防 LLM 產的 XSS)
✅ 不用 eval()、Function() 等動態 code 執行
✅ Chart.js / Tailwind 從固定 CDN 載(版本鎖定),不從不可信來源載

6.2 Gateway 端

SSO 認證:員工已登入公司,cookies 自動帶,Gateway 認 user identity
OData filter 校驗:LLM 產生的 filter 要過 Gateway 校驗(白名單欄位、operator 限制),防 SQL injection / 越權查詢
Rate limit:單一員工每分鐘最多 X 個 query,防 LLM 產的迴圈失控
Audit log:每個 query 記錄(誰、何時、查什麼、回傳幾筆),進 SIEM
CORS 白名單:Gateway 只允許指定 origin(若 HTML 託管在內網檔案分享伺服器,設定該 origin)

6.3 ERP 端

iDempiere AD_Role 自動套:Gateway 帶員工 token 進 iDempiere,業務 Tom 看不到 CFO 才看的到的資料
不直連 ERP:HTML 的 fetch 不直接打 iDempiere,一律走 Gateway proxy。理由:ERP 不該暴露在 internet,Gateway 才是受控邊界
Process call 限制:銷售工具預設 read-only,要寫資料(下單、修改)需要更高層審核或專用工具

七、CORS / 認證的具體做法

三條路徑分析:

路徑	CORS	認證	推薦
HTML → 直連 iDempiere REST	需開 iDempiere CORS 設定	JWT token 存 HTML(危險)	❌ 不要
HTML → 公司 Gateway → iDempiere	Gateway 設 CORS 白名單	SSO cookies 自動帶	✅ 推薦
HTML → MCP server → iDempiere	MCP server 設 CORS	MCP OAuth 2.1	⚠️ 進階(複雜但可)

分類: 開發集成

跟 AI 寫程式的 15 條軟工紀律 — 用一條真實對話從頭拆解

重點摘要

為什麼問這題

15 條紀律的分類框架

#1 驗證紀律 (Verification Discipline)

#2 正交分解 (Separation of Concerns)

#3 真實基準 (Representative Benchmarks)

#4 文檔作為下個 Session 輸入 (Documentation as Next-Session Input)

#5 Focused Review (一次只 review 一條軸線)

#6 並行/異步執行 (Async Parallel Execution)

#7 回顧 (Retrospective)

#8 規格先於實作 (Spec-First / Specification before Implementation)

#9 權衡分析 (Trade-off Analysis)

#10 預設驗收標準 (Acceptance Criteria Upfront)

#11 可重跑 / Idempotency (Reproducible Execution)

#12 預算控管 (Cost / Budget Cap)

#13 根因分析 (Root Cause Analysis)

#14 錯誤處理哲學 (Error Handling Philosophy)

#15 版本控制紀律 (Version Control Discipline)

15 條全表:做了沒 × leverage

結論:跟 AI 寫程式需要哪些軟工?

不是新的軟工,是舊軟工套到 AI 4 個特性上

個人 leverage 排序(5 強)

沒做的 5 條,該怎麼補

真正的 meta-insight

跟我之前文章的關聯

腦子系統 ISO 整合治理框架:6 篇收成 1 個合規可審計藍圖

重點摘要(TL;DR)

一、問題重述

二、ISO 範圍界定(事實驗證)

2.1 適用標準三件套

2.2 雙標準的重疊與互補

三、六篇文章 × ISO 控制項映射

3.1 ISO 27001:2022 Annex A 對應

3.2 ISO 42001:2023 Annex A 對應(關鍵 9 個 control objectives)

四、Gap 補強方案

4.1 A.5.7 Threat intelligence

4.2 A.5.30 ICT readiness for business continuity

4.3 A.8.28 Secure coding(LLM 產 HTML)

4.4 ISO 42001 偏見緩解(Bias Mitigation)

4.5 AI 事故管理(Incident Management)

五、鄉村包圍踏實落地的 5 個 Phase Gate

5.1 過 Gate 的紀律

六、多場景統一治理框架

6.1 五個共用元件(全公司一套)

6.2 五種角色 × 四類工具的整合矩陣

6.3 確保「正確 / 安全 / 合規 / 整合」的四個機制

七、月度健檢:踏實的可量測指標

7.1 北極星(唯一最重要)

7.2 三個關鍵健檢指標

7.3 月度報告(高層用)

八、稽核準備 90% 自動化

九、12 個月時程(對應第三篇 + 本文)

十、結語:從 6 篇到 1 個治理框架

延伸閱讀:腦子系統七篇

可運作的 Reference Links(2026/5 撰文時驗證)

ISO 標準官方

Annex A 控制項對照(實作指南)

業界實戰

OWASP Top 10 for LLM(對應 A.5.7 Threat Intelligence)

給銷售的 AI 工具:LLM 產自助 HTML × ERP CRUD × 即時資訊圖

重點摘要(TL;DR)

一、使用情境

傳統流程(沒有這個工具)

新流程(本文設計)

二、四層架構

三、混合模式:預載 + 即時刷新

四、LLM 怎麼產 HTML — Prompt 設計

4.1 System Prompt 範例(精簡版)

五、產出 HTML 範例(完整可執行)

六、安全設計(必看)

6.1 HTML 端

6.2 Gateway 端

6.3 ERP 端

七、CORS / 認證的具體做法