重點摘要
Claude Code 是「身體」(agent loop、tool use、MCP),模型是「腦子」,claude-code-router(ccswitch) 是「神經接口」,把腦子接上身體。
雲端 LLM 現在真的便宜 :DeepSeek V3.2 每百萬 token USD 0.28/0.42,SWE-bench Verified 72-74%,夠用 80% 場景。不需要為了省錢買硬體 。
但 Anthropic 改價、限額、ToS 變動隨時可能 — 未雨綢繆有必要,可是不要花過頭 。5 萬內買「合理保險」夠了。
10 萬內 3 條路徑:0 元全雲端 (屁股電腦 + cheap API)、3 萬二手 GPU 、5 萬 RTX 5070 Ti 。20+ 萬路徑(RTX 5090 + Mac Studio Ultra)完全不必要。
腦子可以換,工具不能綁架你 — 也不要綁架你家庭預算。
為什麼要換腦:Claude Code 框架真好用,但要有「萬一」準備
Claude Code 提供的是身體 + 技能 :agent loop、tool use、Bash 執行、MCP server 接入、檔案編輯、git 操作、subagent 派遣。這套框架成熟、穩定、文件齊。問題只有一個:底層腦子綁死在 Anthropic API 。
講真的,2026 年雲端 LLM 費用真的便宜 。Claude Max USD 100/月、DeepSeek V3.2 一百萬 token 不到 USD 0.5,單看價格就是時代最佳。多數人現階段「為了省錢花 20 萬買 RTX 5090」算式根本算不過來:5 萬月 API 成本 × 80 個月 = 6 年半才回本,而 6 年半後 RTX 7090 都出來了。
但「便宜」不等於「無風險」 。Anthropic 可以隨時改價、限額、deprecate model、改 ToS、加區域限制、政策性下架。「便宜」是現在的事實,「能用」是對方願意 的事實。未雨綢繆 = 確保「對方變心」的那天不會讓我停工 。
這篇講的是合理保險 :用 5 萬內的預算建立 fallback,不是為了省錢、不是為了完全自主、不是為了跑分追 frontier。只是讓你睡得安穩 。
神經接口:claude-code-router 是什麼,怎麼把腦子接上身體
claude-code-router (社群稱 ccswitch )是一個 proxy gateway,綁在 localhost:3456。Claude Code 原本打到 Anthropic API 的請求,router 攔截下來、轉換格式、路由到你指定的後端(OpenRouter / DeepSeek / Ollama / Gemini / Volcengine / SiliconFlow)。[GitHub: musistudio/claude-code-router]
核心能力 3 個:
Transformer :把 Anthropic API request schema 轉換成 OpenAI / Ollama 格式,模型不用知道對方是誰
動態切換 :聊天中用 /model 指令切後端,不重啟
路由策略 :根據 task 類型自動派模型(重任務 → Claude Opus、background → DeepSeek、本地 → Qwen3-Coder)
實際省錢幅度:[Cut Claude Code Bill 90%] 給的數字是 50-90%,看路由邏輯激進程度。但對保留 Claude Max 訂閱的人 ,router 真正的價值不是省錢,是削峰 — 把 subagent / background 派出去,Claude Max 的 weekly quota 留給真正需要 Opus 的任務,永不撞 lockout 。
腦子替換的 3 種劑量
劑量 A:全雲端腦(0 元入場)⭐ 我推這個
router 把全部請求(或除主對話外的全部)丟到便宜 cloud API(DeepSeek V3.2 / Qwen3-Coder API)。本機完全不用裝模型 ,連 Ollama 都不裝。屁股電腦完美參與 — 它只負責跑 Claude Code 跟 router 本身,推理在雲端。
適合:多數人 。除非你有商業機密 / air-gapped 需求,沒理由花硬體錢。
劑量 B:半雲半本地
本地裝中型模型(Qwen3-Coder-30B-A3B 或 Gemma 3 12B)跑 background / 重複性任務,雲端跑重活。需要至少一張 12-16GB VRAM 的 GPU。
適合:日常 coding 主力 + 想壓 API bill 到極致 + 願意花 3-5 萬硬體錢做「保險」。
劑量 C:全本地腦(本文不推)
本地跑 Kimi K2.6(1T MoE)或 DeepSeek V3.2(671B),完全不打雲端。但需要 Mac Studio M4 Ultra 256GB(NT$ 35 萬起) 。對 99% 開發者而言不划算 — 不在本文 5 萬內預算範圍 。
5 萬內的 3 條路徑(具體 part list)
路徑 1:NT$ 0(全雲端 + 屁股電腦)
項目
內容
成本
機器
手邊任何能跑 Node 20 的機器(屁股電腦 / Mini PC / 舊筆電都行)
NT$ 0
claude-code-router
npm install -g @musistudio/claude-code-router
免費
DeepSeek API 帳號
platform.deepseek.com 註冊,買 USD 5 預付
NT$ 150 起
月用量(中度開發者)
DeepSeek V3.2 USD 0.28/M input, USD 0.42/M output
NT$ 500-3,000
這條路最被低估 。多數人以為「本地模型」=「沒網路也能跑」,但實際 90% 場景你有網路,DeepSeek API 比自己跑本地 30B 還快還準。0 硬體成本 + 月 USD 5-15 = 跟 Claude 訂閱比省 70-90% ,而且性能 80% 場景夠用。
路徑 2:NT$ 1.5 萬(二手 GPU 試水溫)
Part
規格
NT$
二手 RTX 3060 12GB
PTT / 露天 / 蝦皮二手
8,000-10,000
PSU 升級到 650W
確保 GPU 供電
3,000
機殼 / 風扇
散熱
1,500
合計
—
~15,000
可跑:Qwen3-Coder-Next(3B active,記憶體吃 ~6GB)、Gemma 3 12B Q4、DeepSeek-R1-Distill-Qwen-14B Q4。40-60 tokens/sec ,互動體驗已過 30 t/s 的「跟 cloud 無感」門檻。[Best GPU for Local LLMs 2026]
適合:「想玩本地但不想砸大錢」 。1.5 萬投資 = 大約 30 個月 DeepSeek API 用量,只在你**確實會用本地** + 想實驗的前提下划算。
路徑 3:NT$ 5 萬(RTX 5070 Ti 16GB 改現有桌機)⭐ 認真做本地的甜蜜點
Part
規格
NT$
RTX 5070 Ti 16GB(新)
2026 最佳 CP 值 LLM 卡
28,000-32,000
PSU 850W
5070 Ti 需 750W+
5,000
RAM 加到 64GB
DDR4 / DDR5 雙通道
6,000
NVMe 2TB
模型 / GGUF 存放
5,000
合計
—
~48,000
可跑:Qwen3-Coder-30B-A3B (MoE,VRAM 吃 ~14GB),80-120 t/s 飛快 。已能應付日常主力 coding,Claude API 退到 background 角色(複雜重構 / 跨檔分析才用)。
適合:真的認真做本地化 + 有現有桌機可以裝顯卡 + 5 萬預算的人 。這條路在 2026 中是「合理保險」最高 CP 值的點。
為什麼不砸 20+ 萬?算給你看
很多「玩 LLM」社群推的是 RTX 5090(NT$ 12-15 萬)或 Mac Studio M4 Ultra 256GB(NT$ 35 萬+)。對 99% 開發者而言,這算式根本算不過來 。
配置
硬體投入
月省 (vs Claude USD 100)
回本年數
折舊風險
路徑 1(全雲端)
NT$ 0
USD 80-95
立刻省
無
路徑 2(NT$ 1.5 萬)
NT$ 15,000
USD 80-90
5-6 個月
低(二手 3060 殘值高)
路徑 3(NT$ 5 萬)
NT$ 48,000
USD 80-100
14-16 個月
中(2 年後 RTX 6070 上市)
RTX 5090 機(NT$ 23 萬)
NT$ 230,000
USD 100(只是不付訂閱)
76 個月 / 6.3 年
高
Mac Studio M4 Ultra(NT$ 40 萬)
NT$ 400,000
USD 100
133 個月 / 11 年
超高
RTX 5090 機 6.3 年才回本 ,但 6 年後 RTX 8090 都出來了,你的 5090 殘值剩 30%。Mac Studio Ultra 11 年回本 ,11 年後 Apple Silicon 已經換了 4 代。
「未雨綢繆」≠「為了不可能發生的事過度準備」 。Anthropic 真的明天倒了,你也能在 5 萬路徑下半天內切到本地 — 那才是「合理保險」。砸 20 萬給「我擔心 Anthropic 變心」,是恐懼定價 ,不是工程。
4 個本地腦子怎麼選(為什麼不一定要追 frontier)
模型
Release
規模
SWE-bench
適合誰
Qwen3-Coder-Next
2026/02
80B MoE / 3B active
SOTA local
5 萬路徑首選 ⭐
Kimi K2.6
2026/04/20
1T MoE
SWE-Bench Pro 58.6% 贏 Opus 4.6
需 Mac Studio Ultra,不在本文範圍
DeepSeek V3.2
2026/Q1
671B MoE
SWE-bench Verified 72-74%
用 API 最划算(自己跑要 256GB RAM)
Gemma 4
2026/04
多 size
—
Apache 2.0 純開源、小機器友善(路徑 2 OK)
來源:[Qwen3-Coder GitHub] 、[Kimi K2.6 完整指南] 、[DeepSeek 完整指南] 、[Gemma releases]
關鍵判斷:不要追 frontier 。Kimi K2.6 跑分贏 Opus 4.6 沒錯,但要 256GB RAM 的 Mac Studio Ultra 才跑得動 = 40 萬硬體。對 5 萬內預算而言,Qwen3-Coder-30B-A3B (30B 規模、3B active MoE,16GB VRAM 就跑得起)已經滿足 80% 場景。剩下 20% 的硬任務丟回 Claude 用 router 解決 。
ccswitch 路由策略:哪個腦子接什麼活
Heavy(複雜重構、跨檔架構分析、安全 review) → Claude Opus 4.7(API 或 Max 訂閱)
Medium(一般 coding、debug、寫 test) → DeepSeek V3.2(API)或 Qwen3-Coder-30B(本地,僅路徑 3)
Light(格式整理、改 typo、寫 commit message、跑 lint) → 本地 Gemma 3 12B(路徑 3)或最便宜 cloud(DeepSeek background tier)
Background(自動產生 README、批次重命名、log 摘要) → 本地小模型或 DeepSeek,跑多久都不心疼
router config 範例:
{
"providers": {
"claude": { "type": "anthropic", "apiKey": "$ANTHROPIC_KEY" },
"deepseek": { "type": "openai", "baseUrl": "https://api.deepseek.com" },
"qwen-local": { "type": "ollama", "baseUrl": "http://localhost:11434" }
},
"routes": [
{ "match": { "complexity": "heavy" }, "provider": "claude", "model": "claude-opus-4-7" },
{ "match": { "complexity": "medium" }, "provider": "deepseek", "model": "deepseek-chat" },
{ "match": { "complexity": "light" }, "provider": "qwen-local", "model": "qwen3-coder:30b" }
]
}
實際省下來的成本:[Claude Code Router 完整 2026 指南] 給的數字是月 API bill 從 USD 200 降到 USD 30-50。如果你保留 Claude Max 訂閱 ,把 subagent / background 路由出去,可以避免撞 weekly quota lockout,實質效益就是 「有效用量翻 2 倍」 。
屁股電腦改造案例:32GB RAM + Ryzen 7 4700U 怎麼玩
我自己手上的 Mini PC:AMD Ryzen 7 4700U(8 cores)、32GB RAM、無獨立 GPU、Linux Mint。前面查過所有資料,這台機器在 2026 的真實處境是:
❌ 30B+ 模型完全跑不動(無 GPU + RAM 不夠)
⚠️ 7B Q4 可跑但 ~3-5 t/s,慢到不能互動
✅ Gemma 3 1B-4B 可跑但太弱,agent 任務跑不完
結論:路徑 1(全雲端)最 fit 我的場景 :
裝 claude-code-router(5 分鐘)
申請 DeepSeek API(10 分鐘,USD 5 預付)
router config 把 medium / light 全部 route 到 DeepSeek V3.2
Heavy 留給 Claude(Max 訂閱 或 API pay-per-token)
Mini PC 繼續扛 Claude Code + router process,VRAM 無關緊要
月成本估:USD 15-30(NT$ 500-1,000)。跟新組 RTX 5070 Ti 桌機(NT$ 5 萬)比,4-8 年才回本 。所以路徑 1 是我目前最 fit 的路徑 — 不是因為我堅持本地化,是因為「本地化」對我來說是未來的選項 ,不是現在的剛需。
真話:不要為了「本地化迷思」花錢,但也不要裸奔
很多人買 RTX 5090 是為了「資料安全 / 不依賴雲端 / 終究有一天用得到」。實際統計:
「資料安全」→ 99% 場景你的 code 在 GitHub public repo / company 內部 repo,傳給 DeepSeek 沒比較危險
「不依賴雲端」→ 你每天還是上 Stack Overflow、Google 搜文檔,雲端依賴沒消失
「終究會用」→ 通常買了之後跑兩週就放著積灰塵,1 年後折舊損失 30%+
真正該本地化的場景:商業機密、air-gapped 環境、隱私法規(GDPR / HIPAA)。個人 / 中小團隊 dev workflow 不在這個 list 內 。
但「不要過度準備」≠「不準備」。裝 router 是免費的 ,就算現在全部 route 給 Anthropic,哪天它變心,你只要改 config 就能切。5 分鐘的事 ,沒理由不做。這才是真正的「未雨綢繆」:架構靈活、邊際成本接近 0 ,而不是花 20 萬買「萬一」。
結尾:腦子可以換,工具不能綁架你 — 也不要綁架你家庭預算
claude-code-router 的真正價值不在「省錢」,是主權 。Anthropic 改價、改 ToS、deprecate model,你不用跟著它的節奏走。換腦只是動作,背後是 ownership 的姿勢:你選你信任的模型、你決定路由邏輯、你不被任何單一廠商綁架 。
具體建議按你場景:
偶爾用 / 屁股電腦 / 預算 0:路徑 1 (全雲端 + DeepSeek API + 5 分鐘 router setup)
想玩本地但不確定會不會堅持:路徑 2 (NT$ 1.5 萬二手 RTX 3060)
真認真做本地化 + 有現有桌機:路徑 3 (NT$ 5 萬 RTX 5070 Ti)
RTX 5090 / Mac Studio Ultra(20+ 萬) :除非有商業機密 / air-gapped 需求,否則 6-11 年回本算式不划算 ,不推
不為了「本地化迷思」花錢。留錢給你該花的地方 — 可能是更好的螢幕、更好的椅子、家人的長照、孩子的教育、未來的不確定性。Claude Code 是工具,換腦只是技術選擇,你才是 own 自己工作流的人 — 也是 own 自己家庭預算的人 。