什麼是 claude-code-router(ccswitch)?

claude-code-router 是一個開源 proxy gateway,綁在 localhost:3456,把 Claude Code 的 API 請求路由到不同後端(OpenRouter、DeepSeek、Ollama、Gemini、Volcengine、SiliconFlow),讓你用便宜的雲端模型或本地模型替換 Anthropic API,省 50-90% 帳單或避免撞 quota lockout。

為什麼雲端便宜還要裝 ccswitch?

雲端 LLM 現在便宜不等於永遠便宜。Anthropic 可以隨時改價、限額、deprecate model、改 ToS。裝 ccswitch 是 5 分鐘的免費保險:配置好之後,如果 Anthropic 變心,只要改 config 就能切到 DeepSeek / 本地。架構靈活、邊際成本接近 0,這才是真正的未雨綢繆。

為什麼不推 RTX 5090 / Mac Studio Ultra?

RTX 5090 機(NT$ 23 萬)對比 Claude USD 100/月訂閱,6.3 年才回本。Mac Studio M4 Ultra 256GB(NT$ 40 萬)11 年才回本。6-11 年後硬體已經折舊,新一代 GPU 上市,投資算式根本算不過來。除非有商業機密 / air-gapped 需求,否則 5 萬內預算就是合理保險的上限。

屁股電腦(32GB RAM 老 Mini PC)也能用 Claude Code + ccswitch 嗎?

可以。走全雲端路徑(NT$ 0 入場):本機只跑 Claude Code 跟 claude-code-router process,所有推理在 DeepSeek / OpenRouter 雲端完成。月成本 USD 5-30,比新組桌機 4-8 年才回本。屁股電腦不是限制,是優勢。

Qwen、Kimi、DeepSeek、Gemma 哪個最適合本地跑?

5 萬內預算首選 Qwen3-Coder-Next(80B MoE,3B active,16GB VRAM 跑得動)。Mac Studio Ultra 玩家才能跑 Kimi K2.6(1T,但要 NT$ 40 萬硬體)。DeepSeek V3.2 671B 自己跑要 256GB RAM,建議直接用 API。Gemma 4 是 Apache 2.0 純開源,小機器跑得動但效能略低於 Qwen,適合路徑 2 的 RTX 3060。

OpenClaw 為什麼被 Anthropic 封鎖?企業要怎麼避免?

2026/4/4 Anthropic 撤銷第三方工具的 OAuth 存取,Claude Pro/Max 訂閱不再支援 OpenClaw 等工具。原因:Claude.ai 訂閱是個人用,違反 ToS 不可 power programmatic workflows;OpenClaw 用 OAuth 把訂閱費當 API 用,Anthropic 形同補貼。企業教訓:永遠用 API key + Enterprise 合約,不要把員工個人訂閱當公司基建。本地模型(Qwen3-Coder-Next + Ollama)+ 開源 chat-native agent(QwenPaw)是唯一不被切的路徑。

OpenClaw 跟 OpenCode 是同一類東西嗎?

完全不一樣。OpenClaw 是 chat-native general-purpose AI agent,跑在本機,原生支援 WhatsApp/Telegram/Slack/Signal/iMessage 等多個 chat app,做 email/行事曆/訂機票/表單填寫等廣義自動化,給全公司員工(含非 RD)用。OpenCode 是 AI coding agent,跑在 terminal/IDE,做寫 code/debug/refactor,給開發者用。OpenClaw 跟 ccbot 是「同層」(行動端介面),不是跟 OpenCode 同層(coding agent)。

對企業 air-gapped BU 最理想的 OpenClaw 替代品是什麼?

QwenPaw (agentscope-ai/QwenPaw)。特色:本地模型優先(Qwen3-Coder-Next、Qwen3.6 等)+ 多 chat app 介面(DingTalk/Feishu/WeChat/Discord/Telegram)。對台灣企業特別合適 — 中文 chat app 支援度最高。其他選項:Nanobot(輕量 4000 行)、PraisonAI(low-code multi-agent)、Hermes Agent(self-improving)、Enclave AI(iPhone/Mac 完全本地)、OpenJarvis(Ollama/vLLM 整合)。

Chat-native Agent 跟 Coding Agent + Bridge 有什麼差別?

後者(如 Claude Code + ccbot)只給 RD 用,只做 coding 任務的行動延伸。前者(如 QwenPaw / OpenClaw)自帶 agent + 自帶多 chat app,做廣義自動化(email/行事曆/訂機票/行政),覆蓋全公司員工含 80% 不寫 code 的人。對萬人集團來說 chat-native 路徑覆蓋面大得多 — 業務、客服、行政、HR 不需要 coding agent,他們要的是 chat app 內直接呼叫的助手。

OpenClaw 事件給企業的最重要教訓是什麼?

四個教訓:(1)永遠用 API key 不要用個人訂閱 OAuth,員工說「用我的 Claude Pro 接公司工具」聽起來省錢,實際上隨時被切;(2)「廠商封鎖風險」要納入工具選型,不要把全公司流量壓在單一廠商;(3)本地模型 + 開源 chat-native agent 是唯一不被綁的路徑(QwenPaw + Ollama + Qwen3-Coder-Next 完全自主);(4)Enterprise 合約 negotiate 時把「policy stability,廠商如改政策提前 90 天通知」寫進去。

小丁的家

標籤: AI 工具中性化

Claude Code 換腦記:雲端便宜但要未雨綢繆,5 萬內路徑

重點摘要

Claude Code 是「身體」(agent loop、tool use、MCP),模型是「腦子」,claude-code-router(ccswitch)是「神經接口」,把腦子接上身體。
雲端 LLM 現在真的便宜:DeepSeek V3.2 每百萬 token USD 0.28/0.42,SWE-bench Verified 72-74%,夠用 80% 場景。不需要為了省錢買硬體。
但 Anthropic 改價、限額、ToS 變動隨時可能 — 未雨綢繆有必要,可是不要花過頭。5 萬內買「合理保險」夠了。
10 萬內 3 條路徑:0 元全雲端(屁股電腦 + cheap API)、3 萬二手 GPU、5 萬 RTX 5070 Ti。20+ 萬路徑(RTX 5090 + Mac Studio Ultra)完全不必要。
腦子可以換,工具不能綁架你 — 也不要綁架你家庭預算。

為什麼要換腦:Claude Code 框架真好用,但要有「萬一」準備

Claude Code 提供的是身體 + 技能:agent loop、tool use、Bash 執行、MCP server 接入、檔案編輯、git 操作、subagent 派遣。這套框架成熟、穩定、文件齊。問題只有一個:底層腦子綁死在 Anthropic API。

講真的,2026 年雲端 LLM 費用真的便宜。Claude Max USD 100/月、DeepSeek V3.2 一百萬 token 不到 USD 0.5,單看價格就是時代最佳。多數人現階段「為了省錢花 20 萬買 RTX 5090」算式根本算不過來:5 萬月 API 成本 × 80 個月 = 6 年半才回本,而 6 年半後 RTX 7090 都出來了。

但「便宜」不等於「無風險」。Anthropic 可以隨時改價、限額、deprecate model、改 ToS、加區域限制、政策性下架。「便宜」是現在的事實,「能用」是對方願意的事實。未雨綢繆 = 確保「對方變心」的那天不會讓我停工。

這篇講的是合理保險:用 5 萬內的預算建立 fallback,不是為了省錢、不是為了完全自主、不是為了跑分追 frontier。只是讓你睡得安穩。

神經接口:claude-code-router 是什麼,怎麼把腦子接上身體

claude-code-router(社群稱 ccswitch)是一個 proxy gateway,綁在 localhost:3456。Claude Code 原本打到 Anthropic API 的請求,router 攔截下來、轉換格式、路由到你指定的後端(OpenRouter / DeepSeek / Ollama / Gemini / Volcengine / SiliconFlow)。[GitHub: musistudio/claude-code-router]

核心能力 3 個:

Transformer:把 Anthropic API request schema 轉換成 OpenAI / Ollama 格式,模型不用知道對方是誰
動態切換:聊天中用 /model 指令切後端,不重啟
路由策略:根據 task 類型自動派模型(重任務 → Claude Opus、background → DeepSeek、本地 → Qwen3-Coder)

實際省錢幅度:[Cut Claude Code Bill 90%] 給的數字是 50-90%,看路由邏輯激進程度。但對保留 Claude Max 訂閱的人,router 真正的價值不是省錢,是削峰 — 把 subagent / background 派出去,Claude Max 的 weekly quota 留給真正需要 Opus 的任務,永不撞 lockout。

腦子替換的 3 種劑量

劑量 A:全雲端腦(0 元入場)⭐ 我推這個

router 把全部請求(或除主對話外的全部)丟到便宜 cloud API(DeepSeek V3.2 / Qwen3-Coder API)。本機完全不用裝模型,連 Ollama 都不裝。屁股電腦完美參與 — 它只負責跑 Claude Code 跟 router 本身,推理在雲端。

適合:多數人。除非你有商業機密 / air-gapped 需求,沒理由花硬體錢。

劑量 B:半雲半本地

本地裝中型模型(Qwen3-Coder-30B-A3B 或 Gemma 3 12B)跑 background / 重複性任務,雲端跑重活。需要至少一張 12-16GB VRAM 的 GPU。

適合:日常 coding 主力 + 想壓 API bill 到極致 + 願意花 3-5 萬硬體錢做「保險」。

劑量 C:全本地腦(本文不推)

本地跑 Kimi K2.6(1T MoE)或 DeepSeek V3.2(671B),完全不打雲端。但需要 Mac Studio M4 Ultra 256GB(NT$ 35 萬起)。對 99% 開發者而言不划算 — 不在本文 5 萬內預算範圍。

5 萬內的 3 條路徑(具體 part list)

路徑 1:NT$ 0(全雲端 + 屁股電腦)

項目	內容	成本
機器	手邊任何能跑 Node 20 的機器(屁股電腦 / Mini PC / 舊筆電都行)	NT$ 0
claude-code-router	npm install -g @musistudio/claude-code-router	免費
DeepSeek API 帳號	platform.deepseek.com 註冊,買 USD 5 預付	NT$ 150 起
月用量(中度開發者)	DeepSeek V3.2 USD 0.28/M input, USD 0.42/M output	NT$ 500-3,000

這條路最被低估。多數人以為「本地模型」=「沒網路也能跑」,但實際 90% 場景你有網路,DeepSeek API 比自己跑本地 30B 還快還準。0 硬體成本 + 月 USD 5-15 = 跟 Claude 訂閱比省 70-90%,而且性能 80% 場景夠用。

路徑 2:NT$ 1.5 萬(二手 GPU 試水溫)

Part	規格	NT$
二手 RTX 3060 12GB	PTT / 露天 / 蝦皮二手	8,000-10,000
PSU 升級到 650W	確保 GPU 供電	3,000
機殼 / 風扇	散熱	1,500
合計	—	~15,000

可跑:Qwen3-Coder-Next(3B active,記憶體吃 ~6GB)、Gemma 3 12B Q4、DeepSeek-R1-Distill-Qwen-14B Q4。40-60 tokens/sec,互動體驗已過 30 t/s 的「跟 cloud 無感」門檻。[Best GPU for Local LLMs 2026]

適合:「想玩本地但不想砸大錢」。1.5 萬投資 = 大約 30 個月 DeepSeek API 用量,只在你**確實會用本地** + 想實驗的前提下划算。

路徑 3:NT$ 5 萬(RTX 5070 Ti 16GB 改現有桌機)⭐ 認真做本地的甜蜜點

Part	規格	NT$
RTX 5070 Ti 16GB(新)	2026 最佳 CP 值 LLM 卡	28,000-32,000
PSU 850W	5070 Ti 需 750W+	5,000
RAM 加到 64GB	DDR4 / DDR5 雙通道	6,000
NVMe 2TB	模型 / GGUF 存放	5,000
合計	—	~48,000

可跑:Qwen3-Coder-30B-A3B(MoE,VRAM 吃 ~14GB),80-120 t/s 飛快。已能應付日常主力 coding,Claude API 退到 background 角色(複雜重構 / 跨檔分析才用)。

適合:真的認真做本地化 + 有現有桌機可以裝顯卡 + 5 萬預算的人。這條路在 2026 中是「合理保險」最高 CP 值的點。

為什麼不砸 20+ 萬?算給你看

很多「玩 LLM」社群推的是 RTX 5090(NT$ 12-15 萬)或 Mac Studio M4 Ultra 256GB(NT$ 35 萬+)。對 99% 開發者而言,這算式根本算不過來。

配置	硬體投入	月省 (vs Claude USD 100)	回本年數	折舊風險
路徑 1(全雲端)	NT$ 0	USD 80-95	立刻省	無
路徑 2(NT$ 1.5 萬)	NT$ 15,000	USD 80-90	5-6 個月	低(二手 3060 殘值高)
路徑 3(NT$ 5 萬)	NT$ 48,000	USD 80-100	14-16 個月	中(2 年後 RTX 6070 上市)
RTX 5090 機(NT$ 23 萬)	NT$ 230,000	USD 100(只是不付訂閱)	76 個月 / 6.3 年	高
Mac Studio M4 Ultra(NT$ 40 萬)	NT$ 400,000	USD 100	133 個月 / 11 年	超高

RTX 5090 機 6.3 年才回本,但 6 年後 RTX 8090 都出來了,你的 5090 殘值剩 30%。Mac Studio Ultra 11 年回本,11 年後 Apple Silicon 已經換了 4 代。

「未雨綢繆」≠「為了不可能發生的事過度準備」。Anthropic 真的明天倒了,你也能在 5 萬路徑下半天內切到本地 — 那才是「合理保險」。砸 20 萬給「我擔心 Anthropic 變心」,是恐懼定價,不是工程。

4 個本地腦子怎麼選(為什麼不一定要追 frontier)

模型	Release	規模	SWE-bench	適合誰
Qwen3-Coder-Next	2026/02	80B MoE / 3B active	SOTA local	5 萬路徑首選 ⭐
Kimi K2.6	2026/04/20	1T MoE	SWE-Bench Pro 58.6% 贏 Opus 4.6	需 Mac Studio Ultra,不在本文範圍
DeepSeek V3.2	2026/Q1	671B MoE	SWE-bench Verified 72-74%	用 API 最划算(自己跑要 256GB RAM)
Gemma 4	2026/04	多 size	—	Apache 2.0 純開源、小機器友善(路徑 2 OK)

來源:[Qwen3-Coder GitHub]、[Kimi K2.6 完整指南]、[DeepSeek 完整指南]、[Gemma releases]

關鍵判斷:不要追 frontier。Kimi K2.6 跑分贏 Opus 4.6 沒錯,但要 256GB RAM 的 Mac Studio Ultra 才跑得動 = 40 萬硬體。對 5 萬內預算而言,Qwen3-Coder-30B-A3B(30B 規模、3B active MoE,16GB VRAM 就跑得起)已經滿足 80% 場景。剩下 20% 的硬任務丟回 Claude 用 router 解決。

ccswitch 路由策略:哪個腦子接什麼活

Heavy(複雜重構、跨檔架構分析、安全 review)→ Claude Opus 4.7(API 或 Max 訂閱)
Medium(一般 coding、debug、寫 test)→ DeepSeek V3.2(API)或 Qwen3-Coder-30B(本地,僅路徑 3)
Light(格式整理、改 typo、寫 commit message、跑 lint)→ 本地 Gemma 3 12B(路徑 3)或最便宜 cloud(DeepSeek background tier)
Background(自動產生 README、批次重命名、log 摘要)→ 本地小模型或 DeepSeek,跑多久都不心疼

router config 範例:

{
  "providers": {
    "claude": { "type": "anthropic", "apiKey": "$ANTHROPIC_KEY" },
    "deepseek": { "type": "openai", "baseUrl": "https://api.deepseek.com" },
    "qwen-local": { "type": "ollama", "baseUrl": "http://localhost:11434" }
  },
  "routes": [
    { "match": { "complexity": "heavy" }, "provider": "claude", "model": "claude-opus-4-7" },
    { "match": { "complexity": "medium" }, "provider": "deepseek", "model": "deepseek-chat" },
    { "match": { "complexity": "light" }, "provider": "qwen-local", "model": "qwen3-coder:30b" }
  ]
}

實際省下來的成本:[Claude Code Router 完整 2026 指南] 給的數字是月 API bill 從 USD 200 降到 USD 30-50。如果你保留 Claude Max 訂閱,把 subagent / background 路由出去,可以避免撞 weekly quota lockout,實質效益就是 「有效用量翻 2 倍」。

屁股電腦改造案例:32GB RAM + Ryzen 7 4700U 怎麼玩

我自己手上的 Mini PC:AMD Ryzen 7 4700U(8 cores)、32GB RAM、無獨立 GPU、Linux Mint。前面查過所有資料,這台機器在 2026 的真實處境是:

❌ 30B+ 模型完全跑不動(無 GPU + RAM 不夠)
⚠️ 7B Q4 可跑但 ~3-5 t/s,慢到不能互動
✅ Gemma 3 1B-4B 可跑但太弱,agent 任務跑不完

結論:路徑 1(全雲端)最 fit 我的場景:

裝 claude-code-router(5 分鐘)
申請 DeepSeek API(10 分鐘,USD 5 預付)
router config 把 medium / light 全部 route 到 DeepSeek V3.2
Heavy 留給 Claude(Max 訂閱或 API pay-per-token)
Mini PC 繼續扛 Claude Code + router process,VRAM 無關緊要

月成本估:USD 15-30(NT$ 500-1,000)。跟新組 RTX 5070 Ti 桌機(NT$ 5 萬)比,4-8 年才回本。所以路徑 1 是我目前最 fit 的路徑 — 不是因為我堅持本地化,是因為「本地化」對我來說是未來的選項,不是現在的剛需。

真話:不要為了「本地化迷思」花錢,但也不要裸奔

很多人買 RTX 5090 是為了「資料安全 / 不依賴雲端 / 終究有一天用得到」。實際統計:

「資料安全」→ 99% 場景你的 code 在 GitHub public repo / company 內部 repo,傳給 DeepSeek 沒比較危險
「不依賴雲端」→ 你每天還是上 Stack Overflow、Google 搜文檔,雲端依賴沒消失
「終究會用」→ 通常買了之後跑兩週就放著積灰塵,1 年後折舊損失 30%+

真正該本地化的場景:商業機密、air-gapped 環境、隱私法規(GDPR / HIPAA)。個人 / 中小團隊 dev workflow 不在這個 list 內。

但「不要過度準備」≠「不準備」。裝 router 是免費的,就算現在全部 route 給 Anthropic,哪天它變心,你只要改 config 就能切。5 分鐘的事,沒理由不做。這才是真正的「未雨綢繆」:架構靈活、邊際成本接近 0,而不是花 20 萬買「萬一」。

結尾:腦子可以換,工具不能綁架你 — 也不要綁架你家庭預算

claude-code-router 的真正價值不在「省錢」,是主權。Anthropic 改價、改 ToS、deprecate model,你不用跟著它的節奏走。換腦只是動作,背後是 ownership 的姿勢:你選你信任的模型、你決定路由邏輯、你不被任何單一廠商綁架。

具體建議按你場景:

偶爾用 / 屁股電腦 / 預算 0:路徑 1(全雲端 + DeepSeek API + 5 分鐘 router setup)
想玩本地但不確定會不會堅持:路徑 2(NT$ 1.5 萬二手 RTX 3060)
真認真做本地化 + 有現有桌機:路徑 3(NT$ 5 萬 RTX 5070 Ti)
~~RTX 5090 / Mac Studio Ultra(20+ 萬)~~:除非有商業機密 / air-gapped 需求,否則 6-11 年回本算式不划算,不推

不為了「本地化迷思」花錢。留錢給你該花的地方 — 可能是更好的螢幕、更好的椅子、家人的長照、孩子的教育、未來的不確定性。Claude Code 是工具,換腦只是技術選擇,你才是 own 自己工作流的人 — 也是 own 自己家庭預算的人。

2026 年 6 月 2 日

Chat-native AI Agent + Harness 設計 + OpenClaw 事件:腦子系統工具中性化

重點摘要(TL;DR)

AI 工具有三類完全不同定位:Coding Agent(Claude Code / OpenCode)、Chat-native General-purpose Agent(OpenClaw / QwenPaw / Nanobot)、Bridge(ccbot / 官方 Channels)。前一版混淆了,本篇修正。
OpenClaw 事件(2026/4/4):Anthropic 撤銷 OAuth、訂閱費不再支援第三方工具。對企業最重要的教訓:永遠用 API key 走 Enterprise 合約,不要把員工個人訂閱當公司基建。
OpenClaw 替代品光譜:QwenPaw(對企業 air-gapped 最優)、Nanobot(輕量)、PraisonAI(low-code multi-agent)、Hermes / grip-ai / Chatbox / Enclave AI 等。
Harness 設計(Anthropic 2026/3 三 agent 方法論):Simplicity First / Strip away non-load-bearing / Evaluator 看任務難度。模型升級時主動砍腳手架。
企業整合三版本:A(Claude Code + 官方 Channel)、B(Claude Code + ccbot + Gateway)、C(QwenPaw + Ollama + Gateway 完全 air-gapped)。可同時並存於同一集團不同 BU。
本文是腦子系統四部曲第四篇(Tools 工具中性化),前三篇:Why / How / Scale。

一、修正前篇:三類工具的真實定位

本文重寫前一個版本,因為前版誤把 OpenClaw 當作 OpenCode 處理。實際上這兩個工具完全不同類,分屬不同層的解決方案。整個生態系應該分成三類來看:

類別	代表工具	主要任務	介面	目標用戶
A. Coding Agent	Claude Code、OpenCode、Cursor、Aider、Cline、Codex CLI	寫 code、debug、跨檔案 refactor	Terminal / IDE	RD / DevOps
B. Chat-native General Agent	OpenClaw、QwenPaw、Nanobot、PraisonAI、Hermes	email / 行事曆 / 訂機票 / 表單填寫 / 一般行政自動化	原生支援多 chat app(WhatsApp/Telegram/Slack/Signal/iMessage)	全公司員工(含非 RD)
C. Bridge / Channel	ccbot、Anthropic 官方 Channels、CloudCLI	把 Coding Agent 延伸到行動端	Telegram / Discord / iMessage	RD(出差/移動中)

關鍵 insight:B 類(Chat-native)對「萬人集團 80% 不寫 code 的員工」覆蓋面最大 — 業務、客服、行政、HR 不需要 coding agent,他們要的是 email / 行事曆 / 訂機票 / 表單自動化,而且要從原本就在用的 chat app 直接呼叫。

二、OpenClaw 事件:企業導入的重大警訊

2.1 事件時間軸

2025/11:作者 Peter Steinberger(奧地利開發者)發布 Clawdbot
2026/2/14:作者宣布加入 OpenAI(這個時間點在後續事件中很微妙)
2026/3:Clawdbot 改名 OpenClaw,支援 50+ integrations
2026/4/4:Anthropic 正式撤銷第三方工具的 OAuth 存取,Claude Pro/Max 訂閱不再支援 OpenClaw 等工具(改算 extra usage)
2026/4/10:Anthropic 短暫封鎖作者本人帳號,輿論發酵後恢復

2.2 為什麼被封鎖

Anthropic 的官方說法:違反 Consumer Terms of Service。

Claude.ai 訂閱(Pro / Max)是個人用 — 「for personal use through Anthropic’s own interfaces」
不可 power programmatic workflows(自動化流程、批次處理)
OpenClaw 用 OAuth 把訂閱費當 API 用,實質是「訂閱價跑 API 等級流量」 — Anthropic 形同補貼
Anthropic 法務頁面明寫:「Using OAuth tokens obtained through Claude Free, Pro, or Max accounts in any other product, tool, or service — including the Agent SDK — is not permitted」

2.3 對企業的四個重大教訓

永遠用 API key,不要用個人訂閱 OAuth:員工說「我用我的 Claude Pro 帳號接公司工具」聽起來省錢,實際上隨時被切。企業 AI 基建只能架在 Enterprise 合約 + API key 之上。
「廠商封鎖風險」要納入工具選型:同一家廠商可能因為政策、競爭、法務等原因突然改規則。OpenClaw 的 50 倍成本上漲、不少 OpenAI 第三方工具被封鎖、API rate limit 突調 — 都是真實案例。不要把全公司流量壓在單一廠商。
本地模型 + 開源 chat-native agent 是唯一不被綁的路徑:OpenClaw + Anthropic 訂閱會被切,但 QwenPaw + Ollama + Qwen3-Coder-Next 完全自主,沒有任何第三方可以動你的服務。對 A 級資料 BU 是必選。
合約條款要求「廠商如改政策提前 90 天通知」:Enterprise 合約 negotiate 時,把「policy stability」寫進去。Anthropic 對個人訂閱可以說改就改,但對 Enterprise 客戶通常得提前通知 — 這個條款要爭取。

三、OpenClaw 替代工具完整地圖

OpenClaw 事件後,生態系冒出大量替代品。按企業適用場景分:

3.1 對企業 air-gapped BU 最理想:QwenPaw

來源:agentscope-ai 開源(原名 CoPaw,2026 改名 QwenPaw 強調 Qwen 生態整合)
特色:本地模型優先(Qwen3-Coder-Next、Qwen3.6 等)+ 多 chat app 介面(DingTalk / Feishu / WeChat / Discord / Telegram)
對台灣企業:中文 chat app 支援度最高,適合製造業 / 集團內部
適合:萬人集團 A 級 BU、要完全 air-gapped、製造業 BOM / 財務 / HR

3.2 輕量化:Nanobot

來源:香港大學,4,000 行 Python(對比 OpenClaw 的 430K 行)
支援:Telegram / Discord / WhatsApp / Slack / Email out of the box
適合:小團隊、想完全掌控代碼、不需要 50+ integrations 的企業

3.3 多 agent 編排:PraisonAI

特色:low-code 多 agent 平台,100+ LLM 支援,內建 handoffs / guardrails / memory / RAG
支援:Telegram / Discord / WhatsApp
適合:需要 Anthropic 三 agent harness 設計、但不想自己從頭寫的企業

3.4 其他主流選項

工具	特色	適合
Hermes Agent	self-improving 學習迴圈,從複雜任務生 skill 文件	需要長期累積能力的場景
grip-ai	Claude Agent SDK based,31 tools,826 tests	仍想用 Anthropic 但要可控的開發者
NanoClaw	5 個檔案 vs 430K 行,Linux 容器隔離,WhatsApp focus	資安要求高、要細粒度隔離
Chatbox	統一介面接 ChatGPT / Claude / Gemini / Ollama	員工想跨多家 LLM 的桌面用戶
Enclave AI	iPhone / Mac 完全本地,語音對話	A 級資料行動端、無雲依賴
OpenJarvis	Ollama / vLLM / SGLang / llama.cpp 整合,有 learning loop	已有本地推理基建的企業
Moltworker	Cloudflare 推出的 self-hosted personal agent	已用 Cloudflare 生態的企業

四、Harness 設計方法論

「Harness」(腳手架)是 Anthropic 2026 提出的核心工程概念,指 AI agent 周邊的所有非模型組件:system prompt、memory 機制、tool 定義、context 管理、agent 多步循環、評估迴圈。Anthropic 在 Harness design for long-running application development(2026/3)正式發表了完整方法論。

4.1 Anthropic 三 agent harness

Agent 角色	職責	Handoff 產出
Planner	把模糊的初始 prompt 展開成詳細規格	feature 清單(Anthropic 範例 200+ 條)
Generator	執行核心工作、實作功能、自我評估進度	code + progress tracking artifact
Evaluator / QA	用具體 criteria 獨立評估,抓 generator 漏掉的 gap	合格/不合格 + 具體缺漏清單

三 agent 分離的目的:解決長時間任務的 context overflow。一個 agent 跑 8 小時 context 會爆,三個 agent 用 structured handoff artifact 傳遞狀態,每個 agent 自己 context 重置 — 這就是 Anthropic 講的「maintain coherence across multiple context windows」。

4.2 公司腦子系統如何映射到 Harness

Anthropic Harness 元件	公司腦子系統對應	維護方
System Prompt	global/CLAUDE.md(Iron Rules)	Working Group
Memory(persistent)	公司腦 brain markdown + 個人腦	Curator + 員工自己
Tools / MCP servers	Skills(可重用能力包)+ 內部 RAG	RD + 部門 Curator
Context 管理	build.sh 編譯時依目標 model 過濾	RD
Evaluator agent	Curator 月度 review + KPI Dashboard + ISO 稽核	準 CISO + Curator

4.3 修改 Harness 的三條原則

Simplicity First:找最簡解,需要才增加複雜度。每個 harness 元件都 encode 了一個假設「模型自己做不到 X」 — 這些假設要定期 stress-test。
Strip away non-load-bearing pieces:模型升級時(Opus 4.5 → 4.6 → 4.7),原本必要的腳手架可能變成包袱。Anthropic 觀察 Opus 4.6 比 4.5 需要更少腳手架 — 模型越強,harness 越輕。
Evaluator 看任務難度:「worth the cost when the task sits beyond what the current model does reliably solo」。簡單 CRUD 不需要 evaluator;跨檔案 refactor 才需要。不為對稱加 evaluator,只在它真的攔到問題時保留。

五、行動端通訊三種模式(正確分類)

模式	對應	機制	適合場景
A. Coding Agent + 官方 Channel	Claude Code + 官方 Channels(2026/3/20)	Anthropic 官方 MCP server,連 Telegram/Discord/iMessage	純 Claude Code 用戶、簡單設定
B. Coding Agent + Bridge	Claude Code / OpenCode + ccbot(tmux 之上)	tmux thin layer,讀 pane output、送 keystrokes	RD 想多 session 平行、跨 coding agent
C. Chat-native Agent(Native)	QwenPaw / Nanobot / OpenClaw 等	自帶 agent + 自帶多 chat app,本機跑	全公司員工(含非 RD),日常自動化

關鍵差別:

A 和 B 後面接 Coding Agent(只做 coding 任務的延伸)
C 本身就是 Agent(做廣義自動化:email、行事曆、表單、訂機票)
覆蓋面:A、B 給 RD;C 給全員

5.1 ccbot 機制深入(B 模式代表)

ccbot 是 B 模式主流。技術核心:tmux 之上的 thin control layer,不是 SDK wrapper。

Claude Code 進程原封不動跑在桌機 tmux window
ccbot 監聽 JSONL 轉錄檔(每 2 秒 polling)
Telegram 訊息 → 送 keystrokes 到 tmux pane
terminal output → ccbot 解析後 forward 回 Telegram
1 Telegram topic = 1 tmux window = 1 Claude session

適配到其他 coding agent(OpenCode / Aider / Cline)需要 fork ccbot 改 transcript parser,核心架構不變,1-2 週可做出 v0。

六、企業整合架構:三種模式 × Gateway

6.1 完整流量路徑

員工手機 (WhatsApp / Telegram / Slack / Signal)
    ↓ chat message
┌────────────── 三種入口都進這層 ──────────────┐
│  A: Coding Agent + 官方 Channel              │
│  B: Coding Agent + ccbot Bridge              │
│  C: Chat-native Agent (QwenPaw 等)           │
└────────────────────────────────────────────┘
    ↓ HTTP request 經 BASE_URL 改寫 (關鍵!)
公司 LLM Gateway (LiteLLM + Portkey)
    ├─ Layer 1 regex 脫敏 / 分級
    ├─ Layer 2 小模型 fail-safe
    ├─ 路由 + audit log
    └─ ↓               ↓
       雲端 frontier   本地 Ollama
       (B/C 級,API key) (A 級)

三種模式的共同點:都要把 endpoint 指向公司 Gateway,讓分級 / 脫敏 / audit 都生效。不可以讓員工的 Chat-native Agent 直接連 Anthropic / OpenAI 的 API,即使是 Enterprise 合約也不該繞過 Gateway。

6.2 安全考量(必看)

訊息 channel 也要分級:Telegram / Discord / WhatsApp 訊息會經過第三方伺服器 → 即使 Gateway 端脫敏,訊息已經先到第三方。建議:
- Slack(enterprise)/ Mattermost(self-host)→ B/C 級可
- Signal → B 邊界、C 級可
- Telegram / Discord / WhatsApp → 僅 C 級
- iMessage → 視所在地區法規(歐盟禁、台灣彈性)
- A 級 BU(財務 / HR / BOM 配方 / 法務)禁止任何外部 chat channel,只能 Mattermost self-host
身份驗證:Bridge / Chat-native Agent 必設 ALLOWED_USERS 白名單,綁員工 chat app 帳號;離職立即撤銷
不要用個人訂閱 OAuth:OpenClaw 事件的核心教訓 — 員工說「我用我的 Claude Pro 接公司工具」聽起來省錢,實際上隨時被切;公司基建只能架在 API key + Enterprise 合約

七、企業導入的三個版本

A 基礎版:Claude Code + 官方 Channels

適合:80 人以下、已用 Claude Code、員工以 RD 為主
成本:Anthropic Enterprise 合約 + 官方 Channels 免費
工程量:1 人 1 週設定完成
限制:覆蓋率低(只給寫 code 的人)、A 級資料無法處理

B 開源版:Claude Code + ccbot + 公司 Gateway

適合:80-1000 人、有 RD 維護能力、想多 session 平行
成本:Anthropic Enterprise + ccbot 自架 + 公司 Gateway
工程量:1.5 RD x 2-3 個月
限制:仍綁 Anthropic、覆蓋率仍偏 RD、A 級資料要走 Mattermost self-host

C 完全本地版:QwenPaw + Ollama + 公司 Gateway ⭐

適合:萬人集團、製造 / 金融 / 國防 / 醫療,有 air-gapped 法規要求
成本:QwenPaw 免費 + GPU 機房(中央 1x H100 + 多台 4090)+ Mattermost self-host + 公司 Gateway
工程量:2-3 RD x 4-6 個月
優勢:
- 整套 air-gapped,A 級資料完全可處理
- 不被任何雲端 LLM 廠商鎖死(OpenClaw 事件不會發生在你身上)
- 覆蓋全公司員工(含 80% 不寫 code 的人)
- 支援中文 chat app(QwenPaw 原生支援 DingTalk / Feishu / WeChat)

三個版本可以同時並存於同一集團:RD BU 用 B 版(Claude Code + ccbot)做 coding;業務 / 客服 / 行政用 C 版(QwenPaw)做日常自動化;管理層內部工具用 A 版(官方 Channels)。不同 BU 不同需求,Gateway 是唯一共用層。

八、結語:工具中性化 + 廠商獨立

不應該把員工綁在某個 AI 工具的某個 UI 上,也不應該把公司基建綁在某家廠商的政策善意上。

讓員工選工具(Claude Code / OpenCode / QwenPaw / OpenClaw),選位置(桌機 / 手機 / 平板),選通訊頻道(Telegram / Discord / Signal / Slack / WhatsApp / Mattermost)。公司只負責 Gateway 那層的腦子注入和分級路由。

OpenClaw 事件提醒我們:廠商可以在任何時間用任何理由改規則。本地模型 + 開源工具 + 自有 Gateway 是唯一不會被切的路徑。Bridge 和 Gateway 正交組合,工具汰換不影響腦子系統 — 這才是真正的工具中性化。

同樣道理:模型升級時,Anthropic 教我們「strip away non-load-bearing pieces」。腦子系統的每季健檢就是這個原則的應用。Harness 不是寫一次就完的,是隨模型演化、隨廠商政策變動而調整的活系統。

2026/5 工具與事件參考

OpenClaw 事件:TechCrunch 報導、The Register
Anthropic Channels:官方文件(2026/3/20 發布)
ccbot:six-ddc/ccbot(Telegram ↔ tmux thin bridge)
QwenPaw:agentscope-ai/QwenPaw(本地優先,多 chat app)
Anthropic Harness Engineering:Harness design for long-running application development(2026/3)
Awesome Harness Engineering:ai-boost/awesome-harness-engineering

2026 年 5 月 2 日