為什麼Step 6分級對應表這麼關鍵?

Step 6是整個系統的權威來源。沒有分級表,Step 9 Gateway的規則沒依據、Step 7脫敏字典不知道擋什麼、Step 14 ISO稽核找不到資料分級的根據。三層漏斗、雙引擎、KPI Dashboard全部依賴這張表。法務一句『不確定就A級』就會讓整個系統失效,所以邊界case預設B級不是A級。

為什麼不直接禁網頁版ChatGPT就好?

禁不掉。員工有手機、有家裡電腦、有私人帳號。物理上管不到的東西不要假裝管得到,那會變成沒人遵守的合規劇場。正確做法是讓公司Gateway比網頁版好用(自動注入公司腦、整合codebase、串流速度快、不用自己付費),用拉力把人留住。

全部用本地LLM不送雲為什麼不行?

三個現實問題:(1)2026/5本地頂級(Qwen3-Coder-Next 80B-A3B MoE、Kimi K2.6、DeepSeek V4)雖大幅進步,跟frontier雲端(Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro)仍差一檔,在long-context agentic和tool orchestration上明顯;(2)80人並發本地inference仍需中央GPU投資;(3)強制全本地會把員工逼到地下偷用ChatGPT。正確答案是雙引擎:A級任務本地、B/C級脫敏後送雲,並依任務型別路由到最適合的雲端模型。

員工為什麼不能自己選資料分級?

因為員工不會每次按按鈕。讓他們對每個prompt選🟢🟡🔴,三天就沒人用了。正確做法是系統默默判:Layer 1 regex字典5ms攔90%流量,Layer 2小型分類器300ms攔9%,Layer 3保守fail-safe判B級走脫敏。員工完全感受不到分級存在。

分級對應表多久能定下來?

Phase 0+1約3週可有v0.1粗版,Phase 2試點4-6週收斂,Phase 3全公司持續維護。重點是『先粗版上線+真實流量精修』,不要追求100%完整才上線。每月例會patch,當新增條目每週<5條代表系統收斂中。

為什麼這對RD是雙贏?

傳統IT做了再美的UI客戶都嫌不好用,RD永遠被UI/UX工單吃掉。AI時代轉做『給AI安全取資料的入口』,客戶用自己愛的AI工具,RD回去做ISO流程、資安審核、業務邏輯正確性—真正有複利的工作。Domain knowledge從個人腦袋變成公司資產,可累積可傳承,新人onboarding從3個月縮到3週。

標籤: 脫敏管道

Q: 16週太長,3個月能上線嗎?

可以但要砍Phase 3+4。3個月版=Step 1-8 + 簡化版Gateway(只做proxy+audit log不做分級),Phase 4治理機制延後。重點是先把基礎(雙Repo+分級表+脫敏字典+種子部門)立起來,Gateway可以v0.5先上線、v1.0慢慢迭代。

Q: 16步可以跳哪幾步?

可跳:Step 8(Browser Extension)、Step 15(第二批工具)。不可跳:Step 1(Working Group)、Step 6(分級表)、Step 12(Curator)— 跳了系統會壞。可緩:Step 14(ISO稽核)— 等系統穩定再啟動。

Q: 一個人全職能撐多少?

Phase 0-2(8週)一個人可獨立完成,主要是文件+字典+簡單script。Phase 3 Gateway(8週)要1.5-2個RD,因為要做HA+規則層+雲端本地對接。Phase 4-5(持續)0.5個RD+0.3個CISO角色就能維護。最低配置:1個全職RD+1個準CISO兼職,跑4個月。

Q: 沒有ISO認證需求還要做這套嗎?

要,只是Step 14可以跳。這套架構即使不認證ISO,對『累積domain knowledge』『員工生產力』『資安基線』三件事都有獨立價值。ISO是副產品不是目的,真正的價值是讓RD不再被UI/UX工單吃掉,可以回去做有複利的工作。

80人AI腦子系統實戰建置:從0到上線的16個步驟

重點摘要(TL;DR)

把 80 人 AI 腦子系統從 0 蓋起來,共 5 個 Phase、16 個 Step、約 16 週。本文逐步拆解每一步的目標、動作、產出、坑。
每一步都用四維框架檢查:安全(不洩漏)、穩定(不掛)、累積(知識變資產)、好用(員工願意用)。任何一步如果四維都不過,就砍掉。
核心心法:物理保證 > 規則約束、拉力 > 推力、先粗版再精修、安全在前但好用不能放最後。
順序很重要,不能跳步。例如沒有 Step 6(分級對應表)就做 Step 9(Gateway),Gateway 規則沒依據;沒有 Step 12(Curator)就累積知識,3 個月後變垃圾堆。
本文是《80人公司的AI腦子系統:從個人腦擴展到全公司不洩密的工程設計》的實作續篇。前篇講為什麼,本篇講怎麼做。

為什麼要從「順序」談起

很多公司導入 AI 治理失敗,不是技術不行,是順序錯了。常見錯誤:

先買 Gateway 軟體,再去定資料分級 → 規則沒依據,Gateway 變裝飾
先請大家寫 brain markdown,沒有 Curator 制度 → 3 個月後變過期文件墳場
先做華麗 Dashboard,沒有 audit log 來源 → KPI 是亂編的
先全公司鋪開,沒先試點 → 第一週體驗不好,80 人對系統信任歸零,救不回來

本文每個 Step 都標「為什麼是這個位置」,讓你看完知道哪些可以平行、哪些必須串行。

四維檢查框架

每個 Step 都要回答四個問題。如果一個 Step 四維都打不到 ≥1 分,就砍掉 — 是 nice-to-have,不是 must-have。

維度	問題	具體判斷
🔒 安全	這步降低洩漏面積嗎?	A 級資料更不會出去?稽核能找到證據?
🛡️ 穩定	這步可用性夠嗎?	壞了能降級?有災難回復?HA?
📚 累積	這步留下了什麼長期資產?	員工離職還在?可審計?可移交?
😊 好用	員工這步以後生活更好嗎?	少打字?少切視窗?少等待?少抱怨?

Phase 0:基礎準備(W0–W2)

不要先動程式碼。先把組織結構和知識容器建好。

Step 1 — 召集 Working Group(W0,3 天)

目標:讓 5-7 人(準 CISO + 法務 + IT + 3-4 部門 senior + 老闆 sponsor)成為這套系統的第一批決策者
動作:第一次會議 60 分鐘,議程:同步為什麼要做、確認名單、排定 Phase 0 清單會議、訂下兩週一次例會
產出:一份 working group 章程文件、會議紀錄、共享日曆
四維:🔒 ✅(分級權威來源)、🛡️ —、📚 ✅(決策歷史可追)、😊 ✅(員工知道有人扛責)
常見坑:老闆不到場 → 後面拍板沒人敢動;法務一個人說了算 → 後面所有東西判 A 級

Step 2 — 建立雙 Repo(W1,2 天)

目標:把「公司腦」和「個人腦」變成兩個物理上分離的 git repo
動作:在公司 GitHub Org 建 company-brain(private)、發給每位員工一份 personal-brain template(github classroom 或 cookiecutter)
產出:兩個 repo + README 說明使用方式 + .gitignore 範本
四維:🔒 ✅✅(個人腦永不 push 中央=物理保證)、🛡️ ✅(git 提供版本+回復)、📚 ✅(每筆變更有 PR)、😊 ✅(員工用熟悉的 git workflow)
常見坑:個人腦放公司 GitHub 而不是員工自己的 → 隱私保證失效;沒有 .gitignore 擋掉 .env / 密碼檔 → 第一週就有人 commit 進去

Step 3 — Iron Rules v0(W1-W2,1 週)

目標:寫下 3-5 條全公司必守的紅線,變成 company-brain/global/CLAUDE.md
動作:Working Group 開 1 次會議,每個人提 5 條,合併成 3-5 條全體共識
範例:「禁止把客戶合約原文送雲端 LLM」「Bug log 進公司腦前必須脫敏」「所有 brain 修改必須走 PR」
產出:CLAUDE.md v0 commit 進 company-brain/global/
四維:🔒 ✅(底線設定)、🛡️ —、📚 ✅(規則進 git)、😊 ✅(規則少而清楚 > 50 條沒人記)
常見坑:寫成 30 條 → 沒人記得住;寫太抽象(「做正確的事」)→ 不能執行

Phase 1:同步機制(W3–W4)

讓「腦子」能流到員工每個 AI 工具。不寫 Gateway,先解決 build & sync。

Step 4 — build.sh 中性編譯器(W3,3-5 天)

目標:一個 script 把 markdown 編譯到所有 AI 工具的格式
動作:寫 bash / Python script,輸入 company-brain/ + personal-brain/,輸出:
- .claude/CLAUDE.md(Claude Code / Desktop)
- .cursor/rules/*.mdc(Cursor)
- .github/copilot-instructions.md(Copilot)
- ~/chatgpt-system-prompt.md(ChatGPT 用 Custom GPT 貼用)
關鍵設計:每個 brain 檔的 frontmatter 加 tools: [claude, cursor, copilot, gpt],編譯時依目標 model 過濾
產出:可執行的 build.sh + 4-5 種工具的編譯範例
四維:🔒 ✅(可依工具過濾敏感腦)、🛡️ ✅(編譯失敗有錯誤訊息)、📚 ✅(中性格式不被工具鎖死)、😊 ✅✅(員工不用學新格式)
常見坑:編譯太久 → 員工不願意每天 build,設成 git pre-push hook 自動跑

Step 5 — 種子部門試跑(W4,1 週)

目標:挑 10-15 人的部門(通常是 RD)當第一批用戶,真實流量驗證 Phase 0+1
動作:每天收 1 次回饋(短 Slack 頻道)、每週 1 次 30 分鐘 retro 會議、補 brain
milestone:第一週結束,company-brain 有 ≥10 筆 brain markdown(由種子用戶產出)
四維:🔒 —、🛡️ ✅(早期發現問題)、📚 ✅(brain 種子)、😊 ✅(早期使用者教其他員工)
常見坑:挑錯部門 → 行政部根本不寫 brain;挑太大部門 → 回饋處理不過來。挑用 AI 最多的小團隊

Phase 2:分級與脫敏(W5–W8)

這是整個系統的核心。沒這 Phase,後面 Gateway 全是空殼。

Step 6 — 分級對應表 v0.1(W5-W6,2 週)

目標:列出 50-100 種公司會接觸的資料類型,粗分 A/B/C
動作:Working Group 兩次會議,每次 90 分鐘,一次處理 30 種
產出:company-brain/global/data-classification.md 表格化,進 git 管理
原則:不糾結邊界 → 先有 v0.1 → Phase 2 試點時精修
四維:🔒 ✅✅✅(整套架構的權威來源)、🛡️ —、📚 ✅✅(可審計、可移交)、😊 —(員工目前還用不到,但是後續所有 UX 的基礎)
常見坑:法務說「不確定就 A 級」→ 後續 Gateway 90% 流量被擋,系統失效。**邊界 case 預設 B 級**(脫敏後可送雲),不是 A 級

Step 7 — 脫敏字典 v0(W7,5 天)

目標:三份純文字字典,擋掉 80% 紅字
動作:從 CRM / HR / 專案系統匯出
- client_names.txt(客戶公司名 + 簡稱)
- employee_names.txt(員工姓名 + 暱稱 + Slack ID)
- project_codes.txt(內部專案代號、產品代號、合約格式 regex)
產出:三份 .txt + 每月由 HR / PM 維護的責任分配
進階(可選):接 Microsoft Presidio v2.2.362(2025/3 釋出,2026/5 仍是最新版)當第二層補強。Presidio 是開源 PII 脫敏框架,內建 NER + regex + checksum,支援多語言,還有 image redactor 處理 DICOM 醫療影像。字典擋已知字、Presidio 擋通用 PII(信用卡、身分證、地址等),兩層疊加。
四維:🔒 ✅✅(一次擋掉 80% 洩漏)、🛡️ ✅(純文字,壞不掉)、📚 ✅(離職員工從字典移除有歷程)、😊 ✅(員工不用記哪些字是紅字)
常見坑:字典放 git 中 → 字典本身就是敏感資料(客戶 list)。要放另一個 access-controlled repo,build.sh 用 SSH key 拉

Step 8 — Pre-commit Hook + Browser Extension MVP(W8,1 週)

目標:在員工提交 brain 時、貼資料到網頁版 LLM 時,第一道防線
動作:
- Pre-commit hook(.git/hooks/pre-commit):掃 staged 檔案,字典命中就 block commit
- Browser Extension(Chrome/Edge):偵測 chat.openai.com / claude.ai 的 paste 事件,字典命中跳警告 + 自動替換
產出:兩個工具 + 內部 IT 自助安裝頁
四維:🔒 ✅✅(防呆,擋住 80% 「員工懶得開 IDE」場景)、🛡️ ✅(本地執行,不 break 工作流)、📚 —、😊 ✅(警告比阻擋友善)
常見坑:Pre-commit 跑太慢(掃整個 repo) → 員工 git commit --no-verify 繞過。**只掃 staged diff**,< 1 秒

Phase 3:Gateway 上線(W9–W16)

這是工程量最大的 Phase。前面都做完才有意義。

Step 9 — LLM Gateway 骨架(W9-W11,3 週)

目標:用開源 AI Gateway 做基礎,偽裝 Anthropic / OpenAI API。2026 主流選擇:LiteLLM(unified API 到 100+ providers)、Portkey(內建 guardrails + PII redaction + observability)、Kong AI Gateway。企業常見組合是 LiteLLM 當 proxy + Portkey 做 observability。
動作:
- 架 LiteLLM 在內網(Docker),或用 Portkey self-host
- 第一版只做 proxy + audit log,不做分級
- 讓種子部門切過來:ANTHROPIC_BASE_URL=https://company-llm.internal/v1
產出:可用 Gateway + audit log 進 SIEM + 每日 throughput 報告
四維:🔒 ✅(流量集中)、🛡️ ✅✅(HA + 健康檢查)、📚 ✅✅(全程 audit)、😊 ✅(員工只改一行設定)
常見坑:沒做 HA,Gateway 掛 = 80 人不能工作。**第一天就要 HA**,或備用 endpoint 自動切換

Step 10 — 三層漏斗實作(W12-W14,3 週)

目標:在 Gateway 內加分級 + 路由邏輯
動作:
- Layer 1:Aho-Corasick 演算法搜字典(< 5ms)
- Layer 2:fine-tune 小模型做分類(BERT、Qwen3 1.7B、Llama 3.2 3B 都可),0.1-0.3s
- Layer 3:fail-safe 全部判 B 級走脫敏 + 雲端
產出:三層命中率分布 dashboard
四維:🔒 ✅✅✅(自動分級)、🛡️ ✅(每層獨立可降級)、📚 ✅(每筆分類有紀錄)、😊 ✅(員工無感)
常見坑:一開始就追求 Layer 2 LLM 完美 → 永遠上不了線。**先 Layer 1 + Layer 3 兩層上線**,Layer 2 之後加

Step 11 — 雙引擎接入(W15-W16,2 週)

目標:把雲端 frontier 和本地頂級開源模型都接進 Gateway
動作:
- 雲端:簽 Anthropic Enterprise(Claude Opus 4.7)、Azure OpenAI(GPT-5.5)、AWS Bedrock(多家)、Google Vertex AI(Gemini 3.1 Pro)。要 DPA + zero data retention 條款。2026 主流是「routing by task type」:Opus 4.7 跑 multi-file coding、GPT-5.5 跑 terminal/browser、Gemini 3.1 Pro 跑 long-context research。
- 本地:架 Ollama 或 vLLM(production 用 vLLM,2-4x 並發)+ Qwen3-Coder-Next(80B 總參 / 3B active,MoE,256K context)或 Qwen3.6,給 A 級任務專用。MoE 架構讓消費級 GPU 可跑。
- Gateway 路由規則:A 級 → 本地、B 級 → 脫敏 + 雲端、C 級 → 直接雲端,並依任務型別選最適合的雲端模型。
產出:完整雙引擎可用、第一張月度安全報告(攔了多少 A 級)
四維:🔒 ✅✅✅(A 級永不出去)、🛡️ ✅(雲端掛了本地頂)、📚 ✅(成本/用量數據)、😊 ✅(員工拿到 frontier 能力)
常見坑:用個人帳號的 Claude / GPT → ISO 27001 第三方供應商不過。**必須 Enterprise 合約有 DPA**,費用貴 30-50% 但這是硬門檻

Phase 4:治理機制(W13+,與 Phase 3 並行)

沒這個 Phase,brain 會在 6 個月內變垃圾堆。Gateway 蓋好但沒 KPI,3 個月後沒人知道有沒有效。

Step 12 — Curator 制度(W13,2 週啟動)

目標:每個 team 一個 Curator,有權合併 / 刪除 brain
動作:
- 挑選:每 team 一個 senior(自願 + 部門主管同意)
- 授權:GitHub team admin 權限 + 每週 1 小時 review brain PR
- 儀式:每季全公司「腦子健檢日」,半天清掃過時 brain
產出:Curator list + review SLA(PR 5 個工作天內處理)
四維:🔒 ✅(防止劣化)、🛡️ —、📚 ✅✅✅(知識保鮮)、😊 ✅(垃圾不會堆)
常見坑:Curator 沒被分配時間 → 永遠不 review。**1 小時/週要正式排進 KPI**,不是「有空就做」

Step 13 — KPI Dashboard(W14-W16,3 週)

目標:把 North Star + 四象限 KPI 變成可看的 dashboard
動作:
- 串 Gateway audit log → Grafana / Metabase / 自寫
- 串 firewall log → 偵測網頁版 LLM 流量
- 串 git activity → 計算 brain 增長率
- 每月例會看「3 個問題」:North Star、Top 3 繞過原因、安全收益
產出:每月 dashboard + 月報自動產生
四維:🔒 ✅(可量測)、🛡️ ✅(早期警告)、📚 ✅(歷史趨勢)、😊 ✅(高層願意持續投資)
常見坑:做太多指標(20+)→ 沒人看。**只看 5-7 個**,北極星 + 四象限就夠

Phase 5:長期演進(M5+,持續)

系統上線後不是結束。三件事要持續做。

Step 14 — ISO 對應與稽核準備(M5-M6)

目標:把 Step 1-13 的產出對應到 ISO 27001 / 42001 控制措施
動作:
- 產出 iso-mapping.md:每條 ISO 控制措施 → 對應的 Step + 證據(git log / Gateway log / Dashboard)
- 第一次內部稽核(找外部顧問跑一遍)
- 修正稽核發現的 gap
產出:ISO 對應表 + 稽核 readiness 報告
四維:🔒 ✅✅(對外背書)、🛡️ ✅(壓力測試)、📚 ✅✅(合規資產)、😊 —(這 Phase 員工不會直接受益,但對外贏單時受益)
常見坑:把稽核當一次性活動 → 證書到手就鬆懈,3 年後重審手忙腳亂。**Dashboard 要持續跑**,稽核資料 90% 自動產出

Step 15 — 第二批工具支援(M5+)

目標:涵蓋第一批沒處理的工具
動作:
- ChatGPT 透過 Custom GPT Action 串 Gateway HTTP API
- 移動端 Claude / ChatGPT app(只能靠規則 + 教育,管不到)
- n8n / Dify / 自建 workflow 接 Gateway
四維:🔒 ✅(更多入口受控)、🛡️ —、📚 ✅、😊 ✅(更多員工享受到拉力)

Step 16 — 過時知識淘汰機制(M6+)

目標:防止 brain 累積成考古學遺址
動作:
- 每筆 brain 加 last_verified: 2026-05 frontmatter
- 用量遙測:90 天無 reference 的 brain 自動標 stale: true
- 每季 Curator 審 stale list,合併 / 刪除 / 更新
四維:🔒 —、🛡️ ✅(防誤用過期知識)、📚 ✅✅(品質才是知識的本質)、😊 ✅(搜尋更準)

16 Step 全景表

Phase	Step	時程	產出	主導
0 基礎	1 Working Group	W0	章程 + 例會	準 CISO
0 基礎	2 雙 Repo	W1	git repo x2	IT
0 基礎	3 Iron Rules v0	W2	CLAUDE.md	Working Group
1 同步	4 build.sh	W3	編譯器	RD
1 同步	5 種子部門試跑	W4	≥10 brain	部門主管
2 分級	6 分級對應表 v0.1	W5-W6	A/B/C 表	Working Group
2 分級	7 脫敏字典 v0	W7	三份 .txt	HR + PM
2 分級	8 Pre-commit + Browser Ext	W8	兩個工具	RD
3 Gateway	9 Gateway 骨架	W9-W11	LiteLLM 上線	RD
3 Gateway	10 三層漏斗	W12-W14	分級+路由	RD
3 Gateway	11 雙引擎接入	W15-W16	本地+雲端	RD + 法務(合約)
4 治理	12 Curator 制度	W13+(並行)	Curator list + SLA	部門主管
4 治理	13 KPI Dashboard	W14-W16	月報	準 CISO + RD
5 演進	14 ISO 稽核準備	M5-M6	對應表	準 CISO
5 演進	15 第二批工具	M5+	ChatGPT etc.	RD
5 演進	16 知識淘汰	M6+	stale 機制	Curator

關鍵心法:這 16 步背後的設計原則

1. 安全在前,但好用不能放最後

Phase 0-2 都在做安全基礎設施,但每個 Step 的「好用」維度都要 ≥1 分。**安全是必要不充分,沒有好用的安全系統會被員工繞過,等於沒做**。Step 4 的 build.sh、Step 8 的 Browser Extension,都是「安全 + 好用」並重的範例。

2. 物理保證 > 規則約束

能用 git 結構保證的(Step 2 雙 Repo),不要靠政策文件。能用 Pre-commit hook 自動擋的(Step 8),不要靠員工自律。能用 Gateway 路由強制的(Step 11),不要靠規範。**規則會被忘記,結構不會**。

3. 拉力 > 推力

Step 11 雲端 frontier 接入是「拉力」核心 — 員工為什麼選 Gateway 不選網頁版?因為 Gateway 給他 frontier model + 公司腦自動注入 + 速度更快,**而且不用自己付費**。讓 Gateway 比網頁版好用,員工自然不繞過。

4. 先粗版上線,真實流量精修

Step 6 分級表 v0.1、Step 7 字典 v0、Step 9 Gateway 骨架都明確標 v0 / 骨架。**等想清楚才上線 = 永遠不上線**。Phase 2 試點 4-6 週收斂的速度,比關門想 6 個月快 10 倍。

5. 治理機制與技術建設並行

很多公司先蓋 Gateway 再想 Curator,結果 Gateway 上線 6 個月後 brain 變垃圾堆。Step 12 Curator 在 W13 啟動,**和 Step 13 KPI Dashboard 並行**,因為 brain 累積速度從 Phase 1 試點就開始,治理不能等。

常見問題

16 週太長,3 個月能上線嗎?

可以,但要砍 Phase 3+4。「3 個月版」=Step 1-8 + 簡化版 Gateway(只做 proxy + audit log,不做分級),Phase 4 治理機制延後。**重點是先把基礎(雙 Repo + 分級表 + 脫敏字典 + 種子部門)立起來**,Gateway 可以 v0.5 上線、v1.0 慢慢迭代。

16 步可以跳哪幾步?

可跳:Step 8(Browser Ext)、Step 15(第二批工具)。不可跳:Step 1(Working Group)、Step 6(分級表)、Step 12(Curator)— 跳了系統會壞。可緩:Step 14(ISO 稽核)— 等系統穩定再啟動。

一個人(全職)能撐多少?

Phase 0-2(8 週):一個人可獨立完成,主要是文件 + 字典 + 簡單 script
Phase 3 Gateway(8 週):**要 1.5-2 個 RD**,因為要做 HA + 規則層 + 雲/本地對接
Phase 4-5(持續):0.5 個 RD + 0.3 個 CISO 角色就能維護
**最低配置:1 個全職 RD + 1 個準 CISO 兼職,跑 4 個月**

沒有 ISO 認證需求,還要做這套嗎?

要,只是 Step 14 可以跳。這套架構即使不認證 ISO,**對「accumulating domain knowledge」「員工生產力」「資安基線」三件事**都有獨立價值。ISO 是副產品,不是目的。

結語:安全 / 穩定 / 累積 / 好用,缺一不可

大部分企業 AI 治理失敗,不是某一維崩了,是四維沒有平衡:

只要安全 → 員工地下繞過 → 安全也沒了
只要穩定 → 沒有治理 → 半年後變垃圾堆
只要累積 → 沒有 Gateway → 客戶資料外流
只要好用 → 沒有分級 → 一夕事故

這 16 步的順序,就是「四維平衡的最小可行路徑」。每一步都至少打中兩維,串起來就是一個能跑、能審、能成長、員工願意用的系統。

第 0 週要做的事只有一件:打開行事曆,把 Step 1 的 Working Group 第一次會議排進去。其他 15 步都會跟著動起來。

延伸閱讀:《80人公司的AI腦子系統:從個人腦擴展到全公司不洩密的工程設計》 — 講為什麼這樣設計、雙引擎本地+雲、能管 vs 不能管的邊界、拉力哲學。本文是它的實作續篇。

2026/5 技術棧時間戳

本文 Step 9-11 涉及的具體工具版本以撰文時間為準:

Gateway:LiteLLM(open source)、Portkey(內建 guardrails + PII redaction + 1600+ LLM)、Kong AI Gateway。企業常見組合 LiteLLM + Portkey 雙搭。
本地 LLM:Qwen3-Coder-Next(80B-A3B MoE,256K context)、Qwen3.6、Kimi K2.6、DeepSeek V4、Llama 3.3 70B。Ollama 為日常 default,production 並發推 vLLM V1。
雲端 frontier:Claude Opus 4.7(2026/4)、GPT-5.5(2026/4)、Gemini 3.1 Pro、DeepSeek V4。各家擅長領域不同,「routing by task type」是 2026 主流架構。
PII 脫敏:Microsoft Presidio v2.2.362(2025/3 釋出,2026/5 仍是最新版),含 image redactor + DICOM 支援。
合規認證:ISO/IEC 42001:2023(目前唯一可認證的 AI 管理系統標準)。Schellman、TÜV SÜD、BSI、DNV 都是合格認證機構。

2026 年 5 月 2 日

80人公司的AI腦子系統:從個人腦擴展到全公司不洩密的工程設計

重點摘要(TL;DR)

把個人「腦子系統」(CLAUDE.md + brain markdown + skills)擴展到 80 人公司,核心不是技術,是畫清楚「能管」和「不能管」的邊界。
架構=雙 Repo(公司腦+個人腦)+ LLM Gateway 中間人 + 雙引擎(本地 model + 雲端 frontier)。員工感受不到分級存在,系統默默路由。
分級判斷用三層漏斗:regex 5ms 攔 90%、小型分類器 300ms 攔 9%、保守 fail-safe 1%。不要員工自選,他們不可能每次選。
「拉力 > 推力」:讓 Gateway 比網頁版 ChatGPT 好用,員工自然不繞過。唯一最重要的 KPI 是「Gateway request 數 ÷ (Gateway + 偵測到的網頁版流量)」。
真正的雙贏:傳統 IT 做永遠改不完的 UI,客戶都嫌不好用。AI 時代轉做「給 AI 安全取資料的入口」,客戶用自己愛的 AI 工具,RD 回去做 ISO、審核、累積 domain knowledge。

緣起:為什麼個人腦子系統撐不住 80 個人

過去一年,我在自己的多台電腦之間累積了一套「腦子系統」。它由四件東西組成:全域規則(CLAUDE.md)、領域知識庫(brain markdown,例如 OSGi 踩坑、Kafka 注意事項、Shopee API 陷阱)、可重用的能力包(skills)、自動記憶(MEMORY.md + 各種 user/project/feedback 檔)。同步靠 git repo,個人用 100 分。

但當需求變成「給一間 80 人公司用,讓所有人都能累積知識、快速成長、自行用 AI 開發小工具,並且不限定 Claude Code,可能員工 A 用 Claude、B 用 Cursor、C 用 ChatGPT」,個人架構幾乎所有環節都會崩。本文把整套放大設計鉅細靡遺寫下來,讓 RD 或 IT 主管可以直接拿去當藍圖。

你以為的「腦子」其實是四層

先把概念釐清。很多人講「AI 腦子」其實是把四件不同的東西黏在一起,擴展時要分開看待:

層	內容	載體	擴展邏輯
規則層	Iron Rules、語言、Git 流程、安全紅線	CLAUDE.md / .cursorrules	全公司一致,變動少,PR review 嚴管
知識層	領域踩坑、API 陷阱、業務眉角	brain/*.md	分部門、分主題、有 curator 治理
能力層	可重用 skill、自動化腳本、模板	skills/, plugins	員工貢獻 + PR + 用量遙測
記憶層	個人偏好、進行中工作、context	MEMORY.md / 個人 .md	永遠留個人,不上中央

這四層的擴展方式不一樣。規則層是法律,知識層是百科,能力層是函式庫,記憶層是日記。設計時要分開,不能當一坨處理。

擴展前必須先回答的三個問題

不要直接跳進畫架構圖。先把這三題定義清楚,不同答案會走到完全不同的系統。

Q1:「同時使用」是什麼意思?

(a) 員工各挑工具,讀同一份共用知識 ✅ 正確答案,可實作
(b) 同一任務同時派 Claude + GPT 工作 ❌ 反模式,幾乎沒實用場景

Q2:員工貢獻知識的開放程度?

實務建議:opt-out(預設進公司腦,標記私人才留個人),特別是 bug 經驗 — 踩過的坑是最有價值的共享資產。但 opt-out 強制要配「自動脫敏管道」,不然 raw bug log 一進公司腦就帶四種污染:客戶名、訂單 ID、同事名、合約號。

Q3:資料敏感度怎麼分?

分級	例子	處理方式
A 紅	客戶合約、財務數字、員工個資、未公開合作案	嚴禁所有雲端 AI,只能本地 LLM
B 黃	bug log、客戶踩坑、商務邏輯、process 設計	脫敏後可送雲端
C 綠	純技術問題、開源元件、公開文件	直接送雲端 frontier model

務實話:不要追求 100% 不洩漏,要追求「降低洩漏面積」。100% 在 80 人團隊中不存在,追下去會做出沒人用的合規劇場。

架構藍圖:雙 Repo + LLM Gateway + 雙引擎

┌─ 公司腦 repo (private GitHub Org) ─────────────────┐
│  global/    Iron Rules(PR + 2 reviewer 才能改)      │
│  teams/                                              │
│    backend/  brain/* skills/*                        │
│    frontend/ ...                                     │
│  shared/skills/  跨部門通用 skills                   │
│  build/    編譯器:MD → 各工具格式                    │
│  redact/   自動脫敏規則 + 字典                       │
└──────────────────────────────────────────────────────┘
              │ git pull (每天自動)
              ↓
┌─ 員工本機 ─────────────────────────────────────────┐
│  公司腦/  ← clone 自上面                            │
│  個人腦/  ← 自己的另一個 repo,永遠不 push 中央       │
│  build.sh 把兩者編譯到所有工具:                      │
│   → .claude/CLAUDE.md  (Claude Code/Desktop)        │
│   → .cursor/rules/     (Cursor)                     │
│   → .github/copilot-instructions.md (Copilot)       │
│   → ~/chatgpt-prompt.md (給 Custom GPT 貼用)        │
└──────────────────────────────────────────────────────┘
              │ HTTP / MCP
              ↓
┌─ 公司內網 LLM Gateway ─────────────────────────────┐
│  攔截 → 分級 → 脫敏 → 路由 → 串流回應                │
│  本地 Ollama (A 級任務專用)                         │
│  雲端 frontier (B/C 級脫敏後)                       │
│  審計 log → SIEM                                    │
└──────────────────────────────────────────────────────┘

為什麼是「公司腦 + 個人腦」兩個 repo

員工本機把兩個 repo clone 在一起,build.sh 編譯時個人腦覆寫公司腦(個人偏好優先)
個人腦本機 commit,永遠不 push 到中央 — 這就是「自己選擇要不要上」的物理保證
要分享某筆個人筆記時,員工自己 git mv 進公司腦發 PR
「不上傳」變成預設物理行為,不是靠規則約束

關鍵概念釐清:Brain ≠ Model

很多人問「為什麼一定要雲?所有人都用本地 model 配腦子就好了啊?」這個直覺方向是對的,但前提是要把兩件事拆開:

概念	是什麼	耗 GPU?	在哪
Brain(腦子)	Markdown 文件、規則、踩坑紀錄	❌ 完全不耗	都本地(git repo)
Model(推理引擎)	LLM(Claude / Qwen / Llama)	✅ 很耗	看你選

腦子永遠該全本地,這沒有爭議 — 它就是 markdown 檔。爭議只在 model 要不要本地。所以真正的問題是「為什麼推理引擎要用雲」。

為什麼不能「全本地 model」— 三個誠實的事實

1. 能力差距是真實的

2026/5 現況:本地頂級開源這一年大幅追上 — Qwen3-Coder-Next(80B 總參 / 3B active,MoE 架構,256K native context)已能跟 Claude Code、Cline、OpenCode 等 coding agent 直接整合;Qwen3.6、Kimi K2.6、DeepSeek V4是 2026/4 的 open-weight 第一梯隊。MoE 架構讓 80B 總參只啟動 3B per token,消費級硬體加量化可跑。但跟 frontier 雲端(Claude Opus 4.7(2026/4)、GPT-5.5(2026/4)、Gemini 3.1 Pro、DeepSeek V4)比,在 long-context agentic、跨檔案 reasoning、tool orchestration 上還是差一個檔次。差距比一年前縮小很多,但沒抹平。

2. 80 人「全本地」的硬體成本

中央 inference server(8x A100 80GB):採購百萬人民幣級別 + 機房 + 維運,80 人並發要排隊
每人一台 Mac Studio M3 Ultra 192GB:採購 44 萬美金,出差不能用
對比 80 人用 Claude/GPT API:每人每月 $50-200 美金,年成本 5-20 萬美金
雲端在中小公司階段便宜一個量級

3. 強制全本地會把員工逼地下

能力不夠 → 員工抱怨 → 私下偷貼資料到 ChatGPT。把人逼到地下,比讓他在地上用更糟。雲端 ≠ 資料變成 OpenAI 訓練資料,Enterprise 合約(Azure OpenAI / AWS Bedrock / Anthropic Enterprise)是另一回事。

真正的答案:Local-first, Cloud-when-needed(雙引擎)

員工的 prompt
    ↓
┌─ 本地閘門 (Qwen3-Coder-Next / Qwen3.6) ─────┐
│  1. 偵測敏感度(A/B/C 級)                     │
│  2. A 級:本地 model 直接處理,不出去           │
│  3. B 級:自動脫敏後送雲端                     │
│  4. C 級:直接送雲端                           │
└──────────────────────────────────────────────┘
    ↓ (B / C 級才會到這)
┌─ 雲端 frontier model ────────────────────────┐
│  Claude Opus 4.7 / GPT-5.5                  │
│  Gemini 3.1 Pro / DeepSeek V4               │
│  各家擅長領域不同,Gateway 依任務型別路由       │
└──────────────────────────────────────────────┘

這才是「資料安全」和「員工生產力」雙贏的解。全雲洩漏 A 級、全本地犧牲 B/C 級體驗,雙引擎才永續。

LLM Gateway:員工感受不到的中間人

員工不可能每次手動選分級,要他們按 🟢🟡🔴 三天就沒人用了。正確做法是系統默默判,員工不感知。員工的 IDE / Claude Code / Cursor 不直接連雲端 API,改連公司內網的 Gateway:

員工的設定只有一行:
ANTHROPIC_BASE_URL=https://company-llm.internal/v1

之後做什麼都不變。Cursor 還是 Cursor,Claude Code 還是 Claude Code。

Gateway 的三個職責:

職責	在做什麼	用什麼
分級	判 A / B / C	Regex + 本地小型 LLM 分類器
脫敏	B 級資料抽掉客戶名/同事名/合約號	字典 + regex + 本地 LLM 補刀(Microsoft Presidio 可借力)
路由	送本地還是送雲端	規則引擎

三層漏斗:5ms 路由掉 90% 流量

不是「每個 prompt 都過 LLM 判」,那會塞爆。是三層漏斗:

Layer 1:Regex / 字典比對(< 5ms,攔 90%)
- 含「大有建設」/「老王」/合約號格式 → 紅,本地
- 純英文技術詞、無中文人名地名 → 綠,雲端
- 命中就路由,不過 LLM
Layer 2:小型分類器(0.1-0.3 秒,攔 9%)
- 用 fine-tune 過的 BERT 或 1B-7B LLM 做專門分類
- 不是 70B 判分級,是 1B 做分類
- 100ms 級延遲,員工幾乎感受不到
Layer 3:保守路由(fail-safe,1%)
- 真模糊的 case,全部判 B 級 → 走脫敏 + 雲端
- 寧可多脫敏,不要誤送:錯就錯在不便利,不要錯在洩漏

實際員工體驗:問「這個 process 跑 NPE,客戶大有建設訂單 SO20260415 卡住」→ Gateway 5ms 偵測到「大有建設」「SO\d+」→ 自動改寫成「客戶 [CUSTOMER_A] 訂單 [ORDER_ID]」→ 路由到雲端 Claude → 員工完全不知道發生了什麼,只覺得 AI 答得很好。

能管的世界 vs 不能管的世界

追求 100% 覆蓋會害死系統。要清楚畫出邊界,每塊用對應措施:

範疇	可管性	措施
Claude Code / Cursor / Continue / Aider	✅ 可改 BASE_URL	Gateway 嚴管
Claude Desktop / 自寫 script / n8n	✅ 可改 endpoint	Gateway 嚴管
公司網路出站流量	✅ Firewall force proxy	Gateway 嚴管
ChatGPT 網頁 / Claude.ai 網頁	⚠️ Browser extension 半攔	即時 paste 脫敏 + 警告
GitHub Copilot inline	❌ MS endpoint 不能改	規則 + 教育
手機 app / 私人裝置	❌ 物理上管不到	合約 + 信任 + 事後追溯

核心心法:不假裝管得到不該管的東西。每塊都有對應措施,沒有「假裝有但實際沒有」的灰區。資安部門能說明、員工能理解、出事能追責。

「拉力 > 推力」的設計哲學

對「不能管的世界」,訴諸三層(從硬到軟):

Layer 1: 用「拉力」把人留在 Gateway 裡(最重要)

讓 Gateway 比網頁版好用,員工自然不繞過:

Gateway 自動注入公司腦(員工不用每次貼 context)
Gateway 連 frontier 雲(Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro、DeepSeek V4),員工不用自己付費,還能依任務路由到最強模型
Gateway 整合公司 codebase RAG,網頁版做不到
Gateway 串流速度比網頁版快(內網直連)

這是設計哲學的轉換:不是「禁止你用 X」,而是「Y 比 X 好用」。員工是理性人,會選好用的。80 人裡會有 70 人自動留在 Gateway,不用任何 enforcement。

Layer 2: Browser Extension(半受控的中間地帶)

偵測員工開啟 chat.openai.com / claude.ai / gemini.google.com
input 框 paste 時即時 regex 脫敏
大量 paste(>500 字)跳警告:「這段內含 X 個敏感字,已自動替換 Y 個」
不阻擋、不上報,只做防呆 condom

Layer 3: 規則 + 教育 + 事後追溯

明確紅字 list 寫進員工守則
每季資安訓練(講具體案例)
DLP 遙測不阻擋只記 log,事後可追
離職前 audit log 過一遍

分級對應表怎麼從 0 開始建

這是組織問題不是技術問題。沒有這張表,所有 Gateway 規則都是空的。

誰主導

準 CISO 角色(IT 主管 + 法務 + 老闆都接受的人)
不要 IT 一個人定(太技術)
不要法務一個人定(會把所有東西判 A 級,系統失效)
不要部門主管各說各話

Working Group(5-7 人)

1 × 準 CISO(主導)
1 × 法務(合規紅線)
1 × IT 實作者(技術可行性)
3-4 × 部門 senior(業務視角,挑會用 AI 的人)
1 × 老闆 sponsor(拍板用,不參與每週會)

四個 Phase(漸進式,不要追求一次到位)

Phase	時間	目標
Phase 0	1 週	列資料種類清單(50-100 種)
Phase 1	2 週	粗分 A/B/C,先有 v0.1
Phase 2	4-6 週	挑一部門試點,每週開會精修
Phase 3	持續	全公司 + 月度 patch

五個必避陷阱

❌「不確定就 A 級」→ 系統失效,員工全跑網頁版
❌ 追求 100% 完整才上線 → 永遠定不下來
❌ 一次寫完不再動 → 6 個月後過時,員工不信任
❌ 黑盒不公開 → 員工不知道為什麼被判 A 級
❌ 法務一個人說了算 → 變成沒人用的合規劇場

核心原則:先有粗版上線,再用真實流量精修 > 想清楚再上線。

KPI:唯一最重要的數字

North Star(唯一最重要)

本月 Gateway request 數
÷
(Gateway request 數 + 偵測到的網頁版 LLM 流量)

公司網路 DNS / firewall log 看得到員工開了多少次 chat.openai.com / claude.ai / gemini.google.com(域名級,不看內容,沒有隱私問題)。這個比例 = 「員工選 Gateway 的比例」,目標6 個月內達 90%+。< 70% 代表 Gateway 拉力不夠,要查為什麼。

四象限 Dashboard

象限	指標	目標
採用	月活用戶 / 全員	80%+
替代	North Star	90%+
體驗	Gateway p50 延遲	< 500ms
體驗	月度 NPS(vs 網頁版)	4.0/5+
健康	Layer 1 regex 命中率	> 85%
健康	員工申訴誤判率	< 0.5%

月度報告:三個問題就夠

「上個月 X% 員工選擇 Gateway over 網頁版」← North Star
「員工繞過 Gateway 的 Top 3 原因」← 下個月修哪邊
「Gateway 帶來的安全收益 + 成本」← 攔住多少 A 級洩漏、雲端費用變化

第一個月 MVP 時程

不要一次蓋大廟。Phase 0 砍到極簡,先讓 Claude Code + Cursor 用戶跑起來,驗證治理流程能不能撐 80 人,再擴展。

週	交付
W1	公司腦 repo + 3-5 條 Iron Rules + build.sh(支援 Claude Code & Cursor)
W2	個人腦 repo template + 員工 onboarding 文件 + 第一場培訓
W3	脫敏字典 v0(client_names.txt + employee_names.txt)+ pre-commit hook 擋紅字
W4	Curator 制度上線(每 team 一個 + 每週 1 小時 review)

Brain Server / ChatGPT 整合 / 本地 Ollama / 完整 Gateway → 全部砍到 Phase 1(第 2-4 個月)。樂觀估計:1 個全職工程師 3-4 個月做到可上線 Gateway。悲觀:6 個月 + 2 個工程師。

結語:這是 AI 時代的雙贏

傳統 IT 部門做了再美的 UI,客戶都會嫌不好用 — 這是 ERP 行業 30 年的詛咒。AI 時代的反轉是:不要再做永遠改不完的 UI 了,做「給 AI 安全取資料的入口」就好。客戶用自己愛的 AI 工具(ChatGPT、Claude、Cursor),透過你架的 Gateway 安全地取資料、做事情。

這對 RD 是解放:

不再被「客戶嫌頁面醜」「客戶嫌操作太多步」這類無底洞的 UI/UX 工單吃掉時間
可以回去做真正有複利的工作:ISO 流程符合性、資安審核、業務邏輯正確性
每一個 RD 寫的 brain markdown,都是公司 domain knowledge 的長期資產,不會因員工離職就消失
新進員工從第一天就站在累積的 brain 上工作,onboarding 從 3 個月縮到 3 週

對員工是賦能:每個人都能用自己最熟的 AI 工具,在公司架好的安全護欄內,自行開發小工具、解決自己的痛點。對公司是護城河:domain knowledge 從個人腦袋變成公司資產,可累積、可審計、可傳承。

整套設計的核心心法只有四句:

能管的嚴管,不能管的不假裝管
拉力 > 推力,讓 Gateway 比網頁版好用
員工不感知,系統默默路由
先粗版上線,真實流量精修

剩下的就是把 working group 召集起來,開第一次會。

2026/5 技術參考時間戳

本文涉及的具體模型版本、開源工具、ISO 標準以撰文時間為準,LLM 領域變化快,請以最新發布為主:

雲端 frontier(2026/4 發布):Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro、DeepSeek V4。各家擅長領域不同,「routing by task type」已成為主流架構。
本地頂級開源:Qwen3-Coder-Next(80B 總參 / 3B active,MoE,256K context)、Qwen3.6、Kimi K2.6、DeepSeek V4、Llama 3.3 70B。
本地 LLM 平台:Ollama 仍是預設選擇,production 並發推 vLLM V1(2-4 倍吞吐)。
AI Gateway 開源工具:LiteLLM(unified API to 100+ providers)、Portkey(observability + guardrails + PII redaction)、Kong AI Gateway。2026 企業常見組合是 LiteLLM 當 proxy + Portkey 做 observability。
PII 脫敏:Microsoft Presidio v2.2.362(2025/3 釋出,2026/5 仍是最新版),含 image redactor 與 DICOM 醫療影像支援。
合規標準:ISO/IEC 42001:2023(AI 管理系統,目前唯一可認證 AI 標準)、ISO 27001:2022、ISO 27701。Schellman、TÜV SÜD、BSI、DNV 都是合格認證機構。

2026 年 5 月 2 日