Claude Code 訂閱 6/15 拆分對一般使用者影響大嗎?

對「個人從終端機 / IDE 互動式使用 Claude Code,搭配 Agent tool 派 subagent」這類典型使用者,影響趨近於零。互動池維持訂閱補貼價不變。只有四類具體模式會被搬到 SDK Credit Pool:claude -p 無頭命令、Claude Agent SDK、Claude Code GitHub Actions、第三方包裝(OpenClaw / Conductor / Zed / Jean)。

SDK Credit Pool 額度是多少?用完會怎樣?

Pro $20、Max 5x $100、Max 20x $200、Team Standard $20/seat、Team Premium $100/seat,按 API 全價算,額度不滾存每月歸零。用完後可選 enable overage(繼續按 API 全價收費,可能讓訂閱費 + 超支費比直接買 API 還貴)或 disable overage(請求被 reject 直到下個月)。

2026 中本地能跑什麼模型取代 Claude?

Qwen 3.6-27B(Q4 14GB,agentic coding 接近半年前 400B 水準)、Qwen 3.6-35B-A3B(MoE,Q4 18GB,快)、DeepSeek V4-Flash(284B MoE / 13B 啟動,重度量化 33GB VRAM 可跑,1M context)、Llama 3.3 70B(Q4 35GB,ecosystem 最大,異質 diversity 用)。100GB+ RAM 機器可同時 load 多 model 做真實的異質 Agent Team。

OpenClaw 為什麼被 Anthropic 封鎖?企業要怎麼避免?

2026/4/4 Anthropic 撤銷第三方工具的 OAuth 存取,Claude Pro/Max 訂閱不再支援 OpenClaw 等工具。原因:Claude.ai 訂閱是個人用,違反 ToS 不可 power programmatic workflows;OpenClaw 用 OAuth 把訂閱費當 API 用,Anthropic 形同補貼。企業教訓:永遠用 API key + Enterprise 合約,不要把員工個人訂閱當公司基建。本地模型(Qwen3-Coder-Next + Ollama)+ 開源 chat-native agent(QwenPaw)是唯一不被切的路徑。

OpenClaw 跟 OpenCode 是同一類東西嗎?

完全不一樣。OpenClaw 是 chat-native general-purpose AI agent,跑在本機,原生支援 WhatsApp/Telegram/Slack/Signal/iMessage 等多個 chat app,做 email/行事曆/訂機票/表單填寫等廣義自動化,給全公司員工(含非 RD)用。OpenCode 是 AI coding agent,跑在 terminal/IDE,做寫 code/debug/refactor,給開發者用。OpenClaw 跟 ccbot 是「同層」(行動端介面),不是跟 OpenCode 同層(coding agent)。

對企業 air-gapped BU 最理想的 OpenClaw 替代品是什麼?

QwenPaw (agentscope-ai/QwenPaw)。特色:本地模型優先(Qwen3-Coder-Next、Qwen3.6 等)+ 多 chat app 介面(DingTalk/Feishu/WeChat/Discord/Telegram)。對台灣企業特別合適 — 中文 chat app 支援度最高。其他選項:Nanobot(輕量 4000 行)、PraisonAI(low-code multi-agent)、Hermes Agent(self-improving)、Enclave AI(iPhone/Mac 完全本地)、OpenJarvis(Ollama/vLLM 整合)。

Chat-native Agent 跟 Coding Agent + Bridge 有什麼差別?

後者(如 Claude Code + ccbot)只給 RD 用,只做 coding 任務的行動延伸。前者(如 QwenPaw / OpenClaw)自帶 agent + 自帶多 chat app,做廣義自動化(email/行事曆/訂機票/行政),覆蓋全公司員工含 80% 不寫 code 的人。對萬人集團來說 chat-native 路徑覆蓋面大得多 — 業務、客服、行政、HR 不需要 coding agent,他們要的是 chat app 內直接呼叫的助手。

OpenClaw 事件給企業的最重要教訓是什麼?

四個教訓:(1)永遠用 API key 不要用個人訂閱 OAuth,員工說「用我的 Claude Pro 接公司工具」聽起來省錢,實際上隨時被切;(2)「廠商封鎖風險」要納入工具選型,不要把全公司流量壓在單一廠商;(3)本地模型 + 開源 chat-native agent 是唯一不被綁的路徑(QwenPaw + Ollama + Qwen3-Coder-Next 完全自主);(4)Enterprise 合約 negotiate 時把「policy stability,廠商如改政策提前 90 天通知」寫進去。

小丁的家

標籤: Anthropic 封鎖

Q: 從 interactive session 派大量 Agent Team 算 programmatic 嗎?

Anthropic 官方文件沒明寫。技術上,Agent tool 在 interactive Claude Code session 內呼叫的 subagent,認證仍走訂閱、技術上會被歸到互動池。但業界啟發式是「if a Claude session runs without a human watching each turn, it is almost certainly moving to the new credit pool」,大規模並行 Agent Team 精神上接近 programmatic。Anthropic 隨時可以用 fair use 條款補洞或單獨限流帳號,不需要先改政策、不需要通知。

Q: Anthropic 為什麼要拆訂閱?

訂閱本來是「個人吃到飽」設計,Anthropic 賭你打字慢吃不爆 $20 等值 token。但有人用 Agent SDK + 第三方包裝把 $20 訂閱接到 Python 程式 24 小時跑 agent army,等於把吃到飽 buffet 整個載走轉賣。Anthropic 沒禁這條,只把它改成獨立 metered 預算,順便擋 OpenAI Codex 用低價搶 agent 市場,也保住 unit economics 才有錢付算力擴張的帳。

Claude Code 訂閱 6/15 拆分:一個 Max 用戶的 evidence-based 評估與本地化反轉

重點摘要

Anthropic 在 2026/6/15 把 Claude 訂閱拆兩半:互動式(終端機 Claude Code、IDE、claude.ai)維持訂閱補貼價,**程式化(Agent SDK、claude -p、GitHub Actions、第三方包裝)移到獨立 metered credit pool**,按 API 全價算。
對「個人坐下來打字 + 派 Agent Team」這種使用方式,**影響幾乎是零**;真正會被打到的是把訂閱接到 Python 程式跑 24 小時 agent army 的套利型用法。
但「字面合法、精神鑽縫」的灰色地帶會持續存在 — Anthropic 隨時可以用 fair use 條款補洞,你不會收到通知。**真正的應對是把 LLM 從 service 變 commodity**:本地優先 + cloud burst 的 gateway 架構。
2026/5 當下的本地 stack 已經追平 frontier:Qwen 3.6-27B 在 agentic coding 上達到「半年前 400B 級」水準,DeepSeek V4-Flash 用 MoE 把 1M context reasoning 壓到 33GB 量化版可跑。**Claude API 從 default 降級成 escape hatch**。

2026 年 5 月中,Anthropic 連續宣布三波 Claude Code 政策變動。5/6 把 5 小時池額度直接 ×2、Pro/Max 取消尖峰時段;5/13 週池額度 +50%(到 7/13 結束的補貼期);最關鍵的是 5/14 預告、6/15 生效的「訂閱拆分」政策 — 把程式化用量從訂閱補貼池移到獨立 metered credit pool。

這篇文章是我作為一個 Claude Max 訂閱用戶,用 21 個 transcript 實際 audit + 政策原文交叉比對的 evidence-based 評估。涵蓋:三波變動的精確時間軸、Anthropic 拆分的真實業務動機、不同使用模式落到新政策的具體影響、灰色地帶與真實風險,以及用 Qwen 3.6 + DeepSeek V4 反轉成「本地優先」工作架構的可執行路線。

三波政策變動的精確時間軸

2026/5/6 — 5 小時池 ×2、尖峰取消。Claude Code 五小時池對 Pro / Max / Team / 企業版直接加倍。Pro / Max 取消「peak hours」限制。Claude API 的 Tier 1 input tokens 上限 +1500%、output tokens +900%。背景是 Anthropic 跟 SpaceX 簽算力協議,Colossus 1 設施提供 300MW 額外容量、超過 220,000 NVIDIA GPU。

2026/5/13 — 週池 +50%(臨時加碼到 7/13)。週限額提升 50%,適用於 Pro / Max / Team / Enterprise。這是限定期加碼,7/13 之後會回到原本水準(除非 Anthropic 再續延)。業界解讀是 Anthropic 對抗 OpenAI Codex 搶 agent 市場的動作。

2026/6/15 — 訂閱拆兩池(真正的結構變動)。訂閱使用從這天起分成兩個池子:

使用方式	6/15 後歸屬	計費邏輯
終端機 / IDE 內互動式 Claude Code	互動池(訂閱)	不變
claude.ai 網頁 / 桌面 / 手機	互動池(訂閱)	不變
Claude Cowork	互動池(訂閱)	不變
`claude -p` 無頭模式	Agent SDK Credit Pool	按 API 全價
Claude Code GitHub Actions	Agent SDK Credit Pool	按 API 全價
Claude Agent SDK(Python/TS)	Agent SDK Credit Pool	按 API 全價
第三方包裝(OpenClaw / Conductor / Zed / Jean)	Agent SDK Credit Pool	按 API 全價

SDK Credit Pool 額度按訂閱方案分配:Pro $20、Max 5x $100、Max 20x $200,Team Standard $20/seat、Team Premium $100/seat。額度不滾存,每月歸零。耗盡後可選擇 enable overage(繼續按 API 全價收費)或 disable overage(請求被 reject)。

Anthropic 為什麼要拆?

訂閱政策本來是「個人吃到飽」設計。Anthropic 賭你打字慢、思考慢,$20 一個月吃不爆等值的 API token 量。這個賭注在「個人開發者用 Claude 寫 code」場景下成立 — 一個人類一天寫不了 10 萬行的對話。

但 Claude Agent SDK + 第三方包裝(OpenClaw、Conductor、Zed、Jean)讓人可以把 $20 訂閱接到自己寫的 Python 程式,24 小時不停跑 agent army,實際 token 量遠超過 $20 等值。等於把吃到飽 buffet 整個載走轉賣 — 訂閱被當成「便宜 API」用於 production 流量。

Anthropic 沒禁這條路,只是把它改成獨立 metered 預算 — 「載走轉賣」要另外算錢,「個人坐下來吃」不動。順便擋住 OpenAI Codex 用低價搶 agent 市場,也保住 unit economics 才有錢付 SpaceX 那 300MW 算力擴張的帳。

實際使用模式 audit:21 個 transcript 看出什麼

政策評估不能憑印象,要有實際使用 evidence。我盤點過去 28 天的 Claude 使用情況:

21 個 transcript / 13 個唯一日期:不是每天用,平均一週 3-4 天
互動式為主:全部 transcript 都是終端機 Claude Code session,不是 SDK / API 程式化呼叫
ccbot Telegram bridge:bridging interactive session,不是獨立 inference
5 個 claude-harness-* hook:全是 SessionStart / PostToolUse / PreCompact 注入,在 session 內運行
claude-limited cgroup wrapper:也是互動 session 內
Agent Team 18-25 並行:從 interactive session 用 Agent tool 派
/loop, /schedule, GitHub Actions, 第三方包裝:全沒有
crontab 11 條:全是 stock data 收集(analyst / TDCC / 機構投資人),完全不叫 Claude
唯一例外:某個內部 LLM 評估 harness 有一條 subprocess.run(["claude", "-p", ...])

把這份 audit 對照 6/15 政策表格,結果出奇地簡單:21 個 transcript 裡有 20 條繼續走訂閱池,只有 1 個 evaluation harness 那條 claude -p 會搬到 SDK Credit Pool。

政策真正落到「典型重度使用者」頭上的點

對於從終端機 / IDE 互動式使用 Claude Code、用 Agent tool 派 subagent、寫 brain / skill / memory 系統的人 — 也就是 Anthropic 設計訂閱時瞄準的客群 — 6/15 變動實質影響趨近於零。

真正被打到的只有四類具體模式:

把 claude -p 串進 shell pipeline 或 CI/CD:每次 invocation 從訂閱池移到 SDK Credit Pool
用 Agent SDK 寫的 Python / TypeScript 程式:無頭運行的 production agent,完全脫離訂閱
Claude Code GitHub Actions:CI/CD 整合在 workflow 內呼叫 Claude
第三方包裝:OpenClaw、Conductor、Zed、Jean 這些把 Claude 訂閱接成 IDE 後端的工具

如果你已經習慣「人在前面打字,Claude 在後面派 agent 跑」的工作模式,這個政策變動就是 一個不會發生的事件。

灰色地帶:cycle + Agent Team 字面合法但精神鑽縫

但有一種模式介於兩者之間,Anthropic 官方文件沒明寫:從 interactive session 派出大量 Agent Team,搭配 /loop 或 hook-based cycle 讓 session 自動延續。

技術上這完全合法。6/15 政策字面只點四個對象:claude -p、Agent SDK、GitHub Actions、第三方包裝。「cycle + 大量 Agent Team + 自動啟動循環」如果全部跑在 interactive Claude Code session 裡(用 Agent tool 派、用 /loop 接同 session、用 hook 觸發),技術上會被歸到互動池。

但這顯然是「字面 vs 精神」的縫。Anthropic 拆這條政策的精神,就是要擋「沒人盯每一回合的大量自動化」 — 第三方分析給出的啟發式是:「if a Claude session runs without a human watching each turn, it is almost certainly moving to the new credit pool」。從這個精神判讀,大規模並行 Agent Team + 自動 cycle 精神上根本就是 programmatic,只是技術上沒被點名。

兩個現實風險

風險一:這個縫不會永遠在。Anthropic 看到統計上的 outlier 用戶(Max 訂閱跑出 Tier 4 API 等級的 token 量),下一輪政策補刀的機率不低。半年後可能變「subagent 從 interactive 派也算 programmatic」、或「同 session 自動 cycle 超過 N 次轉計費池」。歷史上 Anthropic 對訂閱濫用模式都是先觀察後動手 — 5/14 這次拆分本身就是這個 pattern 的證據。

風險二:Fair use 抽象條款隨時可以動你。Terms of Service 寫的「abuse / excessive use」沒精確定義,他們覺得單帳號太誇張就可以單獨 throttle 你帳號,不需要先改政策、不需要事前通知。被點到的人通常只看到「Claude 突然變慢 / 限額變嚴 / 某些 tool 失效」,不會收到正式告知信。

精確版說法:「字面合法、精神鑽縫、風險押在 Anthropic 不回頭補洞」。在他們補洞之前你賺,補了之後可能在毫無預警的下次續訂看到 SDK credit 開始扣 — 或更早,某一天突然發現自己被限流。

反轉戰略:從 service 用戶變成 commodity operator

真正的應對不是「擠到最後一秒用爆」,是 把工作系統的依賴從 Claude 拆出來,讓 LLM 變成可替換的 commodity。這個轉變的本質是反轉預設值:

層級	現在(service 模式)	反轉後(commodity 模式)
日常 code / reasoning	Claude 預設,本地 fallback	本地預設,Claude API 偶爾 burst
Agent Team	Claude 的 Agent tool	本地 orchestrator + 多 model 異質並行
超長 context	Claude API	Qwen 3.6 / DeepSeek V4 / Gemini 三家擇優
A 級 PII / 客戶名 / 合約	本地 7B(品質不夠)	本地 70B 級,品質可用且不上雲
vendor lock-in 風險	Anthropic 政策變動 = 工作系統危機	改 gateway config 而已

架構的關鍵是 gateway 抽象層:用 LiteLLM 或自己寫一個薄 wrapper,讓所有 code 對外只看到一個介面 llm.complete(prompt, model_tier="cheap|standard|premium")。底下接什麼模型是 config,不是 code。Claude 政策再變、Anthropic 真的把帳號限流、OpenRouter 出新便宜模型 — 改一個 config 全部換完,所有專案不動。

2026/5 最新 open weights stack:本地能跑什麼

2026 中的 open weights 市場已經到「local 27B ≈ 半年前的 frontier closed」階段。對於配備獨顯 + 100GB+ RAM 的工作站,實際可選的本地 stack:

Qwen 3.6 系列(2026/3-4 發布)

Qwen 3.6-27B(dense)— flagship 級 agentic coding,Q4 約 14GB VRAM。官方宣稱超越上一代 Qwen 3.5-397B-A17B,即「27B 在 2026 ≈ 半年前 400B 的水準」
Qwen 3.6-35B-A3B(MoE,35B 總參數 / 3B 啟動)— Q4 約 18GB。MoE 設計每次只算 3B 參數所以很快,適合並行 Agent Team
Qwen 3.6 Plus / Max-Preview — closed weights API only。Plus 在 Terminal-Bench 2.0 已贏 Claude 4.5 Opus(61.6 vs 59.3),SWE-bench Verified 還小輸(78.8 vs 80.9)。1M context、reasoning 預設。當 cloud burst 比 Anthropic API 更划算

DeepSeek V4(2026/4/24 發布)

V4-Flash:284B 總參數 / 13B 啟動 MoE,完整模型需 ~170GB VRAM,重度量化壓到 33GB VRAM 可跑(2× RTX 4090 或 1× RTX 6000 Ada)
V4-Pro:1.6T 總 / 49B 啟動 — 100GB RAM 跑不了,跳過
1M context native,hybrid attention(CSA + HCA)推理 FLOPs 比 V3.2 省 73%
這是「反思 / 跨領域類比」的本地頂配

Llama 3.3 70B 與其他

Llama 3.3 70B ecosystem 最大,Q4 約 35GB。不再是 2026 中的首選,但作為「異質 diversity」角色仍有意義 — 同一 task 給不同 model 看,異質訓練資料能產生 outlier insight,單一 model 並行做不到。

100GB+ RAM 機器的實際配置

100GB 對 Qwen 3.6 系列來說是過剩配置。所以這台機器的設計目標不是「能跑大 model」,是「多 model 並行讓 Agent Team 有真實 diversity」:

常駐 hot 在記憶體(同時 load):
├── Qwen 3.6-27B  → 主力 code / 對話       (~14GB)
├── Qwen 3.6-35B-A3B → 快速 Agent Team 主體 (~18GB,MoE 跑很快)
├── DeepSeek V4-Flash 量化版 → reasoning 深度  (~33GB)
└── Qwen 3.6-7B 之類 → 路由 / 簡單分類     (~5GB)
總計 ~70GB,留 30GB 給 vLLM cache + OS + agent 並行 context

按需 load(cold,需要時起):
├── Llama 3.3 70B Q4 → 異質 diversity 用    (~35GB)
└── 其他特殊微調 model

Cloud burst 的新排序

在 2026 中的市場狀態下,Anthropic API 不再是首選 burst 選項。新排序建議:

Qwen 3.6 Plus API(阿里雲)— 主 burst。超長 context + 一般複雜任務。價格約 Claude Sonnet 的 1/3,Terminal-Bench 已贏 Claude 4.5 Opus
Gemini API(Google)— multimodal / OCR / 大文件處理
DeepSeek V4-Flash API — reasoning 硬 case 沒本地版時的備援
Claude API — 只有「Anthropic 那條 reasoning 風格特別合用」的 edge case 才開,從 default burst 降級成偶爾用一下的特殊風味

架構全景圖

把上面所有層拼在一張圖上:應用層 → LiteLLM gateway 路由 → 本地 vLLM(95% 流量)+ Cloud burst(5%)→ 底層 model-agnostic 的 brain / skill / memory data layer。

APPLICATION LAYER
Aider · Open WebUI · Custom Agent Orchestrator(walsin/teams 通用化)

↓

OpenAI-compatible API

LITELLM GATEWAY
routing rule = config,不是 code

task tier	→	backend
code / chat	→	LOCAL Qwen 3.6-27B
Agent Team	→	LOCAL Qwen 3.6-35B-A3B(MoE,快)
reasoning	→	LOCAL DeepSeek V4-Flash(量化)
routing	→	LOCAL Qwen 3.6-7B(輕量分流)
超長 context	→	CLOUD Qwen 3.6 Plus API(1M ctx)
multimodal	→	CLOUD Gemini API
edge reasoning	→	CLOUD DeepSeek V4-Flash API
特殊風味	→	CLOUD Anthropic API(escape hatch,不是 default)

↓

LOCAL(~95% 流量)
vLLM on 100GB+ RAM + GPU

HOT(同時 load):

Qwen 3.6-27B — 14GB
Qwen 3.6-35B-A3B(MoE)— 18GB
DeepSeek V4-Flash 量化 — 33GB
Qwen 3.6-7B 路由 — 5GB

合計 ~70GB,留 30GB 給 vLLM cache + agent 並行 context

COLD(按需 load):

Llama 3.3 70B — 異質 diversity
特殊 fine-tune

CLOUD BURST(~5% 流量)
按 token 計費,非訂閱

Qwen 3.6 Plus — 阿里雲(主 burst)
Gemini API — Google
DeepSeek V4-Flash API
Anthropic API — 偶爾用 only

用途:
• 超長 context (>32K)
• 圖片 / OCR
• 本地解不出來的硬 case
• A 級 PII 絕不出現在這層

↓

DATA / MEMORY LAYER (model-agnostic,完全不動)
Brain.md · Skill.md · Iron Rules · Session Log · RAG Index

	Before(service 模式)	After(commodity 模式)
預設 backend	Claude,Ollama 是 fallback	本地,Cloud API 是 burst
vendor 變動風險	Anthropic 政策動 = 工作系統危機	改一行 LiteLLM config 全部換完
A 級 PII 路徑	本地 7B(品質不夠)	本地 70B 級(品質可用且不上雲)

這張圖的核心訊息:所有 vendor 都在 gateway 後面,application code 完全不知道下面是誰。Claude 政策再變、Anthropic 真的把帳號限流、阿里雲漲價、Gemini 改 API — 改一個 routing config 全部換完,brain / skill / memory data layer 一行不動。

軟體 stack 建議

vLLM — inference server,提供 OpenAI-compatible API。Code 對外就是 OpenAI 格式,model 可以隨時換
LiteLLM — gateway 抽象層。前面接所有 backend(本地 vLLM + Anthropic API + Gemini + Kiro)。Code 只認 LiteLLM,backend 換不換無感
Open WebUI 或 Aider — 取代 Claude Code 對話介面的 interactive REPL
自家 agent orchestrator — 不要依賴 Claude 的 Agent tool,自己寫 multi-process 派發。pattern 可以參考開源的 CrewAI、AutoGen,或像我自己有的 ABC 三級分流 evaluation harness 通用化

過渡期(現在到 6/15)該做的事

建立 baseline metric:從今天開始每天結束前記錄 claude /usage 截圖或 log 到檔案。沒 baseline,出事時你連「被砍多少」都判斷不出來
盤點所有 claude -p 用法:grep -rn "claude -p" ~/ 找出來。每一條都是 6/15 後會從訂閱池搬家的成本點
後備模型 stack cheat sheet:寫一份 1 頁文件「如果 Claude 突然不能用,brainstorming 切去 X、code review 切去 Y、daily 工作切去 Z」。不要等出事才想去哪找
Agent Team 預設規模降到 6-8:18-25 改成「報備使用」。這同時對抗 token 燒速、降低被點為 outlier 的機率,順便逼自己思考「真的需要這麼多視角嗎」
5/20 到 7/13 是補貼期:互動池 +50% 週限額。這 8 週是 Agent Team 衝刺 / 大規模 refactor 最划算時段

真的被限流了怎麼辦

先診斷不要先動作。連 Anthropic console 看是哪一條被扣 — credit pool 被扣 vs 互動池速率變慢是兩個完全不同問題,處理方法不一樣。

立刻把 hot path 切到備援。Agent Team 規模直接砍半、evaluation 暫停或全切非 Claude 後端、日常工作切 Ollama 本地 + Gemini 雲混合。這幾個動作 1 小時內要能做完,不是出事當下才開始研究。

正式申訴 + 評估升 Max 20x。如果你判斷被誤分類(明明是 interactive 被當 programmatic),開 ticket 跟 Anthropic 講。同時評估:接下來工作密度有沒有可能升 Max 20x,把 $200/月 credit 當成「事故緩衝」不是「正常用量」。

結語:訂閱不是 token 額度,是時間窗

最重要的觀念修正:你訂閱 $100/月給你的不是「token 額度」,是「Anthropic 暫時容忍你這種重度用法的時間窗」。這個窗會關。準備的本質是「窗關了我有沒有別條路」,不是「擠到最後一秒用爆」。

反轉成本地優先 + cloud burst 的真正好處,不是省那 $100/月,是 把 LLM 從 service 變成 commodity。你不再是 Anthropic 的 user、Google 的 user、阿里雲的 user,你是一個有自己 stack 的 operator。任何一家政策變、漲價、限流、倒閉,你都只需要改一個 config。

對 2026 中要進企業環境推 LLM 的人來說,這個論述也是直接合規上的加分 — 集團真實場景就是要 A 級 PII 不上雲、不能綁單一 vendor、不能讓核心評估綁在個人帳號上。本地優先架構直接符合這三條,不需要為了合規綁手綁腳。

Anthropic 6/15 拆分對「個人坐下來用」這群人是非事件。但它送出的訊號很清楚:訂閱補貼的時代正在收窄,LLM 市場往真實計費走。早一步做反轉的人,不是因為政策才動 — 是因為看到方向,提早把脆弱性拿掉。

2026 年 5 月 20 日

Chat-native AI Agent + Harness 設計 + OpenClaw 事件:腦子系統工具中性化

重點摘要(TL;DR)

AI 工具有三類完全不同定位:Coding Agent(Claude Code / OpenCode)、Chat-native General-purpose Agent(OpenClaw / QwenPaw / Nanobot)、Bridge(ccbot / 官方 Channels)。前一版混淆了,本篇修正。
OpenClaw 事件(2026/4/4):Anthropic 撤銷 OAuth、訂閱費不再支援第三方工具。對企業最重要的教訓:永遠用 API key 走 Enterprise 合約,不要把員工個人訂閱當公司基建。
OpenClaw 替代品光譜:QwenPaw(對企業 air-gapped 最優)、Nanobot(輕量)、PraisonAI(low-code multi-agent)、Hermes / grip-ai / Chatbox / Enclave AI 等。
Harness 設計(Anthropic 2026/3 三 agent 方法論):Simplicity First / Strip away non-load-bearing / Evaluator 看任務難度。模型升級時主動砍腳手架。
企業整合三版本:A(Claude Code + 官方 Channel)、B(Claude Code + ccbot + Gateway)、C(QwenPaw + Ollama + Gateway 完全 air-gapped)。可同時並存於同一集團不同 BU。
本文是腦子系統四部曲第四篇(Tools 工具中性化),前三篇:Why / How / Scale。

一、修正前篇:三類工具的真實定位

本文重寫前一個版本,因為前版誤把 OpenClaw 當作 OpenCode 處理。實際上這兩個工具完全不同類,分屬不同層的解決方案。整個生態系應該分成三類來看:

類別	代表工具	主要任務	介面	目標用戶
A. Coding Agent	Claude Code、OpenCode、Cursor、Aider、Cline、Codex CLI	寫 code、debug、跨檔案 refactor	Terminal / IDE	RD / DevOps
B. Chat-native General Agent	OpenClaw、QwenPaw、Nanobot、PraisonAI、Hermes	email / 行事曆 / 訂機票 / 表單填寫 / 一般行政自動化	原生支援多 chat app(WhatsApp/Telegram/Slack/Signal/iMessage)	全公司員工(含非 RD)
C. Bridge / Channel	ccbot、Anthropic 官方 Channels、CloudCLI	把 Coding Agent 延伸到行動端	Telegram / Discord / iMessage	RD(出差/移動中)

關鍵 insight:B 類(Chat-native)對「萬人集團 80% 不寫 code 的員工」覆蓋面最大 — 業務、客服、行政、HR 不需要 coding agent,他們要的是 email / 行事曆 / 訂機票 / 表單自動化,而且要從原本就在用的 chat app 直接呼叫。

二、OpenClaw 事件:企業導入的重大警訊

2.1 事件時間軸

2025/11:作者 Peter Steinberger(奧地利開發者)發布 Clawdbot
2026/2/14:作者宣布加入 OpenAI(這個時間點在後續事件中很微妙)
2026/3:Clawdbot 改名 OpenClaw,支援 50+ integrations
2026/4/4:Anthropic 正式撤銷第三方工具的 OAuth 存取,Claude Pro/Max 訂閱不再支援 OpenClaw 等工具(改算 extra usage)
2026/4/10:Anthropic 短暫封鎖作者本人帳號,輿論發酵後恢復

2.2 為什麼被封鎖

Anthropic 的官方說法:違反 Consumer Terms of Service。

Claude.ai 訂閱(Pro / Max)是個人用 — 「for personal use through Anthropic’s own interfaces」
不可 power programmatic workflows(自動化流程、批次處理)
OpenClaw 用 OAuth 把訂閱費當 API 用,實質是「訂閱價跑 API 等級流量」 — Anthropic 形同補貼
Anthropic 法務頁面明寫:「Using OAuth tokens obtained through Claude Free, Pro, or Max accounts in any other product, tool, or service — including the Agent SDK — is not permitted」

2.3 對企業的四個重大教訓

永遠用 API key,不要用個人訂閱 OAuth:員工說「我用我的 Claude Pro 帳號接公司工具」聽起來省錢,實際上隨時被切。企業 AI 基建只能架在 Enterprise 合約 + API key 之上。
「廠商封鎖風險」要納入工具選型:同一家廠商可能因為政策、競爭、法務等原因突然改規則。OpenClaw 的 50 倍成本上漲、不少 OpenAI 第三方工具被封鎖、API rate limit 突調 — 都是真實案例。不要把全公司流量壓在單一廠商。
本地模型 + 開源 chat-native agent 是唯一不被綁的路徑:OpenClaw + Anthropic 訂閱會被切,但 QwenPaw + Ollama + Qwen3-Coder-Next 完全自主,沒有任何第三方可以動你的服務。對 A 級資料 BU 是必選。
合約條款要求「廠商如改政策提前 90 天通知」:Enterprise 合約 negotiate 時,把「policy stability」寫進去。Anthropic 對個人訂閱可以說改就改,但對 Enterprise 客戶通常得提前通知 — 這個條款要爭取。

三、OpenClaw 替代工具完整地圖

OpenClaw 事件後,生態系冒出大量替代品。按企業適用場景分:

3.1 對企業 air-gapped BU 最理想:QwenPaw

來源:agentscope-ai 開源(原名 CoPaw,2026 改名 QwenPaw 強調 Qwen 生態整合)
特色:本地模型優先(Qwen3-Coder-Next、Qwen3.6 等)+ 多 chat app 介面(DingTalk / Feishu / WeChat / Discord / Telegram)
對台灣企業:中文 chat app 支援度最高,適合製造業 / 集團內部
適合:萬人集團 A 級 BU、要完全 air-gapped、製造業 BOM / 財務 / HR

3.2 輕量化:Nanobot

來源:香港大學,4,000 行 Python(對比 OpenClaw 的 430K 行)
支援:Telegram / Discord / WhatsApp / Slack / Email out of the box
適合:小團隊、想完全掌控代碼、不需要 50+ integrations 的企業

3.3 多 agent 編排:PraisonAI

特色:low-code 多 agent 平台,100+ LLM 支援,內建 handoffs / guardrails / memory / RAG
支援:Telegram / Discord / WhatsApp
適合:需要 Anthropic 三 agent harness 設計、但不想自己從頭寫的企業

3.4 其他主流選項

工具	特色	適合
Hermes Agent	self-improving 學習迴圈,從複雜任務生 skill 文件	需要長期累積能力的場景
grip-ai	Claude Agent SDK based,31 tools,826 tests	仍想用 Anthropic 但要可控的開發者
NanoClaw	5 個檔案 vs 430K 行,Linux 容器隔離,WhatsApp focus	資安要求高、要細粒度隔離
Chatbox	統一介面接 ChatGPT / Claude / Gemini / Ollama	員工想跨多家 LLM 的桌面用戶
Enclave AI	iPhone / Mac 完全本地,語音對話	A 級資料行動端、無雲依賴
OpenJarvis	Ollama / vLLM / SGLang / llama.cpp 整合,有 learning loop	已有本地推理基建的企業
Moltworker	Cloudflare 推出的 self-hosted personal agent	已用 Cloudflare 生態的企業

四、Harness 設計方法論

「Harness」(腳手架)是 Anthropic 2026 提出的核心工程概念,指 AI agent 周邊的所有非模型組件:system prompt、memory 機制、tool 定義、context 管理、agent 多步循環、評估迴圈。Anthropic 在 Harness design for long-running application development(2026/3)正式發表了完整方法論。

4.1 Anthropic 三 agent harness

Agent 角色	職責	Handoff 產出
Planner	把模糊的初始 prompt 展開成詳細規格	feature 清單(Anthropic 範例 200+ 條)
Generator	執行核心工作、實作功能、自我評估進度	code + progress tracking artifact
Evaluator / QA	用具體 criteria 獨立評估,抓 generator 漏掉的 gap	合格/不合格 + 具體缺漏清單

三 agent 分離的目的:解決長時間任務的 context overflow。一個 agent 跑 8 小時 context 會爆,三個 agent 用 structured handoff artifact 傳遞狀態,每個 agent 自己 context 重置 — 這就是 Anthropic 講的「maintain coherence across multiple context windows」。

4.2 公司腦子系統如何映射到 Harness

Anthropic Harness 元件	公司腦子系統對應	維護方
System Prompt	global/CLAUDE.md(Iron Rules)	Working Group
Memory(persistent)	公司腦 brain markdown + 個人腦	Curator + 員工自己
Tools / MCP servers	Skills(可重用能力包)+ 內部 RAG	RD + 部門 Curator
Context 管理	build.sh 編譯時依目標 model 過濾	RD
Evaluator agent	Curator 月度 review + KPI Dashboard + ISO 稽核	準 CISO + Curator

4.3 修改 Harness 的三條原則

Simplicity First:找最簡解,需要才增加複雜度。每個 harness 元件都 encode 了一個假設「模型自己做不到 X」 — 這些假設要定期 stress-test。
Strip away non-load-bearing pieces:模型升級時(Opus 4.5 → 4.6 → 4.7),原本必要的腳手架可能變成包袱。Anthropic 觀察 Opus 4.6 比 4.5 需要更少腳手架 — 模型越強,harness 越輕。
Evaluator 看任務難度:「worth the cost when the task sits beyond what the current model does reliably solo」。簡單 CRUD 不需要 evaluator;跨檔案 refactor 才需要。不為對稱加 evaluator,只在它真的攔到問題時保留。

五、行動端通訊三種模式(正確分類)

模式	對應	機制	適合場景
A. Coding Agent + 官方 Channel	Claude Code + 官方 Channels(2026/3/20)	Anthropic 官方 MCP server,連 Telegram/Discord/iMessage	純 Claude Code 用戶、簡單設定
B. Coding Agent + Bridge	Claude Code / OpenCode + ccbot(tmux 之上)	tmux thin layer,讀 pane output、送 keystrokes	RD 想多 session 平行、跨 coding agent
C. Chat-native Agent(Native)	QwenPaw / Nanobot / OpenClaw 等	自帶 agent + 自帶多 chat app,本機跑	全公司員工(含非 RD),日常自動化

關鍵差別:

A 和 B 後面接 Coding Agent(只做 coding 任務的延伸)
C 本身就是 Agent(做廣義自動化:email、行事曆、表單、訂機票)
覆蓋面:A、B 給 RD;C 給全員

5.1 ccbot 機制深入(B 模式代表)

ccbot 是 B 模式主流。技術核心:tmux 之上的 thin control layer,不是 SDK wrapper。

Claude Code 進程原封不動跑在桌機 tmux window
ccbot 監聽 JSONL 轉錄檔(每 2 秒 polling)
Telegram 訊息 → 送 keystrokes 到 tmux pane
terminal output → ccbot 解析後 forward 回 Telegram
1 Telegram topic = 1 tmux window = 1 Claude session

適配到其他 coding agent(OpenCode / Aider / Cline)需要 fork ccbot 改 transcript parser,核心架構不變,1-2 週可做出 v0。

六、企業整合架構:三種模式 × Gateway

6.1 完整流量路徑

員工手機 (WhatsApp / Telegram / Slack / Signal)
    ↓ chat message
┌────────────── 三種入口都進這層 ──────────────┐
│  A: Coding Agent + 官方 Channel              │
│  B: Coding Agent + ccbot Bridge              │
│  C: Chat-native Agent (QwenPaw 等)           │
└────────────────────────────────────────────┘
    ↓ HTTP request 經 BASE_URL 改寫 (關鍵!)
公司 LLM Gateway (LiteLLM + Portkey)
    ├─ Layer 1 regex 脫敏 / 分級
    ├─ Layer 2 小模型 fail-safe
    ├─ 路由 + audit log
    └─ ↓               ↓
       雲端 frontier   本地 Ollama
       (B/C 級,API key) (A 級)

三種模式的共同點:都要把 endpoint 指向公司 Gateway,讓分級 / 脫敏 / audit 都生效。不可以讓員工的 Chat-native Agent 直接連 Anthropic / OpenAI 的 API,即使是 Enterprise 合約也不該繞過 Gateway。

6.2 安全考量(必看)

訊息 channel 也要分級:Telegram / Discord / WhatsApp 訊息會經過第三方伺服器 → 即使 Gateway 端脫敏,訊息已經先到第三方。建議:
- Slack(enterprise)/ Mattermost(self-host)→ B/C 級可
- Signal → B 邊界、C 級可
- Telegram / Discord / WhatsApp → 僅 C 級
- iMessage → 視所在地區法規(歐盟禁、台灣彈性)
- A 級 BU(財務 / HR / BOM 配方 / 法務)禁止任何外部 chat channel,只能 Mattermost self-host
身份驗證:Bridge / Chat-native Agent 必設 ALLOWED_USERS 白名單,綁員工 chat app 帳號;離職立即撤銷
不要用個人訂閱 OAuth:OpenClaw 事件的核心教訓 — 員工說「我用我的 Claude Pro 接公司工具」聽起來省錢,實際上隨時被切;公司基建只能架在 API key + Enterprise 合約

七、企業導入的三個版本

A 基礎版:Claude Code + 官方 Channels

適合:80 人以下、已用 Claude Code、員工以 RD 為主
成本:Anthropic Enterprise 合約 + 官方 Channels 免費
工程量:1 人 1 週設定完成
限制:覆蓋率低(只給寫 code 的人)、A 級資料無法處理

B 開源版:Claude Code + ccbot + 公司 Gateway

適合:80-1000 人、有 RD 維護能力、想多 session 平行
成本:Anthropic Enterprise + ccbot 自架 + 公司 Gateway
工程量:1.5 RD x 2-3 個月
限制:仍綁 Anthropic、覆蓋率仍偏 RD、A 級資料要走 Mattermost self-host

C 完全本地版:QwenPaw + Ollama + 公司 Gateway ⭐

適合:萬人集團、製造 / 金融 / 國防 / 醫療,有 air-gapped 法規要求
成本:QwenPaw 免費 + GPU 機房(中央 1x H100 + 多台 4090)+ Mattermost self-host + 公司 Gateway
工程量:2-3 RD x 4-6 個月
優勢:
- 整套 air-gapped,A 級資料完全可處理
- 不被任何雲端 LLM 廠商鎖死(OpenClaw 事件不會發生在你身上)
- 覆蓋全公司員工(含 80% 不寫 code 的人)
- 支援中文 chat app(QwenPaw 原生支援 DingTalk / Feishu / WeChat)

三個版本可以同時並存於同一集團:RD BU 用 B 版(Claude Code + ccbot)做 coding;業務 / 客服 / 行政用 C 版(QwenPaw)做日常自動化;管理層內部工具用 A 版(官方 Channels)。不同 BU 不同需求,Gateway 是唯一共用層。

八、結語:工具中性化 + 廠商獨立

不應該把員工綁在某個 AI 工具的某個 UI 上,也不應該把公司基建綁在某家廠商的政策善意上。

讓員工選工具(Claude Code / OpenCode / QwenPaw / OpenClaw),選位置(桌機 / 手機 / 平板),選通訊頻道(Telegram / Discord / Signal / Slack / WhatsApp / Mattermost)。公司只負責 Gateway 那層的腦子注入和分級路由。

OpenClaw 事件提醒我們:廠商可以在任何時間用任何理由改規則。本地模型 + 開源工具 + 自有 Gateway 是唯一不會被切的路徑。Bridge 和 Gateway 正交組合,工具汰換不影響腦子系統 — 這才是真正的工具中性化。

同樣道理:模型升級時,Anthropic 教我們「strip away non-load-bearing pieces」。腦子系統的每季健檢就是這個原則的應用。Harness 不是寫一次就完的,是隨模型演化、隨廠商政策變動而調整的活系統。

2026/5 工具與事件參考

OpenClaw 事件:TechCrunch 報導、The Register
Anthropic Channels:官方文件(2026/3/20 發布)
ccbot:six-ddc/ccbot(Telegram ↔ tmux thin bridge)
QwenPaw:agentscope-ai/QwenPaw(本地優先,多 chat app)
Anthropic Harness Engineering:Harness design for long-running application development(2026/3)
Awesome Harness Engineering:ai-boost/awesome-harness-engineering

2026 年 5 月 2 日