Harness 和 Framework 有什麼不同？

Framework（如 LangChain、CrewAI）提供零件讓你自己組裝 agent。Harness（如 Claude Code、Codex CLI）提供完整的運行環境，包含 context 管理、工具呼叫處理、權限控制和失敗處理。Framework 是建築材料，Harness 是建好的房子。

什麼是 Domain Brain？如何建立？

Domain Brain 是按技術領域分類的 markdown 知識庫，記錄過去踩過的坑。建立方法：在 ~/.claude/projects/{project}/memory/brain/ 目錄下，按領域建立 md 文件（如 python-crawler-data.md），格式為「[source: 專案名] 教訓描述」。然後在 CLAUDE.md 強制 agent 開工前讀取。

Claude Code 的 Hooks 可以用來做什麼？

Claude Code Hooks 是在特定事件發生時自動執行的命令。常用的 hook 事件包括：PostToolUse（工具使用後自動跑 linter 或偵測 fix: commit）、PreCompact（context 壓縮前保存重要提醒）、Stop（session 結束時檢查未完成的工作）。Hook 可以返回 JSON 注入 additionalContext，強制 agent 執行特定動作。

如何讓 AI Agent 的知識不會隨 session 消失？

建立閉環 Harness：每次 fix: commit 後用 PostToolUse hook 自動偵測，強制 agent 將教訓寫入 Domain Brain 文件。下次新 session 啟動時，agent 讀取 Brain 就能帶著所有過去的經驗開始工作。這樣知識就從「存在某個 commit 裡」變成「活在每次 session 的 context 裡」。

iDempiere 可以接 AI 嗎？

可以。用 OSGi plugin 作為 UI 入口，HTTP 呼叫獨立的 Python FastAPI 服務，由 LangGraph 路由到 Claude Sonnet 或 Groq Llama。不需要修改 iDempiere 任何既有程式碼。

ERP 接 AI 怎麼保護客戶個資？

使用可逆 PII 脫敏：DB 查詢結果中的姓名、身分證、統編等欄位，在送往外部 LLM 之前替換為 [PII_C_001] 格式的 token。LLM 回答後再還原。LLM 從頭到尾看不到真實個資。

Domain Brain 是什麼？

一種按技術領域（而非按專案）組織開發經驗的知識管理方法。把所有專案踩過的坑濃萃成領域檔案（如 OSGi、2Pack、PO Model），新專案開工前自動載入對應的領域腦。防止跨專案重複踩坑。

為什麼 AI Code Review 會漏掉已知的 bug？

AI 專家 review 只驗證當前文件的邏輯一致性，不會自動跨專案比對歷史踩坑紀錄。除非明確要求 AI 先讀取舊專案的經驗文件，否則同樣的 bug 會重複出現。

怎麼讓 Claude Code 記住上次踩過的坑？

建立跨專案的 pitfalls 記憶檔案（存在 ~/.claude/projects/memory/），在 MEMORY.md 索引中標記為 MANDATORY，這樣每次新對話都會自動載入索引。然後在開始寫計畫之前，明確要求 AI 先讀取相關的 pitfalls 檔案。

AI 專家 review 和經驗傳承有什麼差別？

專家 review 是「這份計畫有沒有邏輯錯誤」，經驗傳承是「上次做類似的事踩了什麼坑」。前者驗證當前文件的正確性，後者需要跨專案歷史比對。兩者都需要，但經驗傳承必須在 review 之前做。

專案太多，AI 怎麼知道要參考哪個舊專案？

目前沒有自動化解法。Claude Code 的記憶系統是平的，沒有語意觸發機制。你需要手動建立跨專案的 pitfalls 記憶檔案，並在 MEMORY.md 標記為 MANDATORY。但如果你自己都忘了有哪些專案，這條防線就會失守。真正需要的是 Git hooks 級別的自動觸發：偵測到同類型工作時，自動列出相關專案的歷史紀錄。

什麼是領域腦（Domain Brain）？怎麼建立？

領域腦是把散落在多個專案 CLAUDE.md 裡的經驗，按技術領域（而非按專案）濃萃成的知識文件。例如所有 OSGi 的坑整理成一份 idempiere-osgi-bundle.md，不管經驗來自哪個專案。建立方法：派 AI agent 讀完所有專案文件，按領域分類萃取，存在記憶系統的 brain/ 目錄下。新經驗直接更新對應領域腦，不用記得來自哪個專案。

跟 AI 合作，資深工程師為什麼反而更容易踩坑？

因為雙方都太有信心。資深工程師一聽就懂，AI 就跳過確認步驟快速產出。結果跳過的步驟裡藏著盲區。如果用戶是新手，AI 反而會更謹慎地每步確認。資深用戶需要主動踩煞車，要求 AI 先讀歷史文件再動手。

為什麼叫 20 個 AI 專家 review 還是會漏 bug？

因為這 20 個專家只看當前文件，不會自動去讀其他專案的歷史紀錄。就像請 20 個新員工審查，但不給他們看前任的交接文件。他們能找到邏輯錯誤，但找不到經驗性的坑。

LangGraph 跟 Claude Code、Cursor、Copilot 有什麼不同？

完全不同層次的東西。Claude Code、Cursor、Copilot 是開發者工具，你用它們來寫程式碼。LangGraph 是開發框架，你用它來造產品（chatbot、自動化流程、API 服務）。前者的使用者是你自己，後者的使用者是你的客戶或系統。

為什麼要用不同的 AI 模型分工合作？

沒有一個模型什麼都最好。Claude Sonnet 擅長架構設計和 code review，Groq Llama 速度快 6 倍且便宜 19 倍，適合寫程式碼。讓擅長「想」的模型去想，讓擅長「做」的模型去做，可以用最低成本達到最高品質。

用 LangGraph 需要訂閱 Claude 或 GitHub Copilot 嗎？

不需要。LangGraph 走的是 API 呼叫，跟 Claude.ai 月費訂閱或 GitHub Copilot 訂閱完全無關。你需要分別申請 Anthropic API key 和 Groq API key，按 token 用量計費。兩個都有免費額度。

為什麼 AI Chatbot 必須用 Streaming？

沒有 Streaming 的 chatbot，使用者要等 3-10 秒才看到整段回應。開啟 Streaming 後，第一個字 200 毫秒就出現，像打字一樣逐字顯示，體感延遲降低 25 倍。只需要把 model.invoke() 改成 model.stream() 就能啟用。

LangGraph Smart Router 能省多少錢？

以每天 100 個問題估算，全部用 Claude Sonnet 月花約 $54，Smart Router 自動切換模型後月花約 $13.50，省 75%。規模越大差距越明顯，1000 個使用者的 SaaS 產品月省 $3000 以上。

什麼場景適合用 LangGraph 多模型？

適合「造東西給別人用」的場景：客服 chatbot、團隊 AI 助手、自動化 CI/CD pipeline、SaaS 產品的 AI 功能、批量內容生成。不適合日常自己寫程式（用 Claude Code 就好）、一次性分析、或不需要控制成本的場景。

作者: tm731531

Hacker News 每日精選 – 2026-04-03
🚀 科技前沿週報：AI 代理人時代的降臨與大廠信心的裂痕

今天的科技圈焦點集中在 AI 模型能力的持續爆發，特別是從「對話」轉向「行動代辦」的重大進展。與此同時，一名前工程師對微軟 Azure 的內部爆料引發了業界對雲端基礎設施可靠性與企業價值的深度討論。身為開發者，了解這股從底層工具到頂層應用的技術變革，將是保持競爭力的關鍵。⚡

🤖 AI / 機器學習

Google 發佈 Gemma 4 開放模型

Google 隆重推出了最新一代的 Gemma 4 系列模型，這是一套基於與 Gemini 相同技術架構的開放權重模型。Gemma 4 在保持輕量化的同時，顯著提升了邏輯推理與多語言處理能力。對於希望在本地環境部署高效能 AI 的開發者來說，這無疑是一個極具吸引力的選擇，進一步縮小了開源與閉源模型之間的差距。✨

原文連結：Google Gemma 4 Official Announcement

Qwen3.6-Plus：邁向真實世界的代理人 (Agents)

阿里巴巴的 Qwen 團隊發表了 Qwen3.6-Plus，這款模型的核心目標是成為能處理複雜任務的「代理人」。它在調用外部工具、規劃長流程任務以及理解真實場景指令方面展現了卓越的實力。這標誌著 AI 發展的新階段：我們不再只是跟機器聊天，而是讓機器幫我們把事情辦成。🛠️

原文連結：Qwen3.6-Plus Blog Post

Cursor 3：AI 代碼編輯器的下一個里程碑

深受工程師喜愛的 AI 編輯器 Cursor 正式推出了第 3 版，進一步強化了其自動補全與上下文理解能力。新版本不僅優化了性能，還引入了更深度的代碼庫索引技術，讓 AI 能夠更精準地根據全專案邏輯進行重構。Cursor 的持續進化，正在重新定義開發者的編程體驗，將「結對編程」提升到新的高度。💻

原文連結：Cursor 3 Release Notes

🛠️ 開發工具與開源專案

Tailscale 的全新 macOS 之家

熱門虛擬網路工具 Tailscale 為其 macOS 版本帶來了全新的界面與架構更新，旨在解決蘋果劉海屏對菜單欄圖標的遮擋問題。這次更新不僅提升了 UI 的美感，更在後端連接穩定性上做了優化。對於依賴 Tailscale 進行內網穿透與安全連接的用戶來說，這是一次體驗上的巨大飛躍。🏠

原文連結：Tailscale’s macOS Update

C89cc.sh – 純 Shell 撰寫的 C89/ELF64 編譯器

這是一個極具駭客精神的開源專案：一個完全用可移植 Shell 腳本撰寫的 C89 編譯器。它能直接生成 ELF64 二進制文件，無需依賴其他重量級編譯工具鏈。這對於理解編譯原理、引導系統（Bootstrapping）以及在受限環境下的開發具有極高的技術價值。🐧

原文連結：C89cc.sh Source on Gist

Home Maker：用 Makefile 管理你的開發環境

這個名為 Home Maker 的專案提出了一種簡約的哲學：使用開發者熟悉的 Makefile 來聲明與管理所有的開發工具。它不試圖取代 Nix 或 Ansible，而是提供一種更輕量、更直觀的方式來同步跨機器的環境設置。對於厭倦了複雜配置框架的人來說，這是一個回歸原始且高效的解決方案。🏠

原文連結：Home Maker Blog Post

🏢 創業、商業與企業文化

前工程師揭秘：那些侵蝕 Azure 信任的決策

一位前 Azure 核心工程師撰文深度剖析了微軟在雲端服務擴張過程中，為了追求增速而忽視基礎設施穩定性的內幕。文章指出，某些短視的技術決策與管理層的官僚化，正在逐步腐蝕客戶對 Azure 的長期信任。這篇爆料在 Hacker News 引發了關於「企業規模與技術債」的激烈討論，是所有技術經理人的警世恆言。⚠️

原文連結：Decisions that eroded trust in Azure

好主意不需要謊言來獲得大眾認可

這是一篇 2008 年的經典舊文重新翻紅，討論了誠實與溝通在推廣新事物中的重要性。作者認為，如果一個想法真的具備價值，就不需要過度包裝或透過誤導來爭取支持。在如今充滿行銷話術與過度承諾的矽谷環境下，這篇文章提醒我們回歸技術與價值的本質。📜

原文連結：Good ideas and Public Acceptance

🔭 其他 (科學與探索)

阿提米絲二號的廁所：登月任務的里程碑

在太空探索中，最基本的生理需求往往是最難克服的工程挑戰。這篇文章詳細介紹了 NASA 為阿提米絲二號 (Artemis II) 任務研發的新型太空廁所。這項看似平凡的設計，實際上涉及到精密的流體力學與廢棄物處理技術，是人類能否長期駐留月球的關鍵一步。🌕

原文連結：Artemis II’s Toilet Tech

木衛一 (Io) 尖塔山的真實形狀

透過最新的觀測數據重構，科學家們終於揭開了木衛一上神秘「尖塔山」的廬山真面目。這座極高且陡峭的山峰在光影交錯中展現了獨特的地理結構，為我們理解木星衛星的火山活動與地殼運動提供了新的科學線索。🌌

原文連結：The True Shape of Io’s Mountain

🎯 今日觀點：總結與行動建議

「當我們從『會寫文章的機器』進化到『會辦事的機器』，技術的重心正在從生成轉向執行。」

從今日的熱門話題中，我們可以看到兩個平行的趨勢：AI 的具身化 (Agentification) 與 基礎設施的信任危機。Gemma 4 與 Qwen3.6-Plus 的發佈，意味著「本地 AI 代理」的門檻大幅降低；而 Azure 的爆料則提醒我們，無論技術多麼先進，可靠性永遠是商業的根基。

💡 給讀者的行動建議：
- 嘗試本地 AI 模型： 下載 Gemma 4 試試在你的開發流程中加入本地推理，減少對 API 的依賴。
- 評估你的工具鏈： 看看 Cursor 3 是否能提升你的編程效率，並思考 Home Maker 這種極簡工具是否適合你的工作流。
- 關注工程文化： 閱讀關於 Azure 的評論，反思在自己的團隊中，是否正為了速度而犧牲了長遠的系統穩定性。
2026 年 4 月 3 日

Harness Engineering 實戰：讓 AI Agent 自動從 Bug 中學習的閉環系統

重點摘要

Harness Engineering 是 2026 年 AI 工程最重要的新學科——不是訓練更好的模型，而是打造讓模型可靠運作的系統
公式：Agent = Model + Harness，Model 是可替換零件，Harness 才是護城河
本文用實際的 Claude Code 設定，展示如何用 Hooks 建立一個會自我進化的閉環 Harness

2025 年，所有人都在比誰的 AI Agent 更厲害。2026 年，贏家已經換了跑道——比的是誰的 Harness 更成熟。

如果你正在用 Claude Code、Codex CLI、或任何 AI coding agent，你每天都在跟 harness 打交道，只是你可能不知道它叫這個名字。這篇文章會用我自己的實戰設定，從零解釋什麼是 Harness Engineering，以及你今天就能動手做的事。

Harness Engineering 是什麼？一句話定義

Harness Engineering 是設計「包裹在 AI 模型周圍的控制系統」的工程學科。用 Martin Fowler 的公式來說：

Agent = Model + Harness

Model 提供智能，Harness 讓這個智能可靠、可控、可用。Phil Schmid 用了一個精準的電腦比喻：

電腦零件	AI 系統對應	說明
CPU	AI Model（GPT、Claude）	原始運算能力
RAM	Context Window	有限的工作記憶
作業系統	Agent Harness	管理資源、提供標準介面、控制生命週期
應用程式	Agent	跑在 OS 上的具體任務邏輯

你不會直接在 CPU 上跑程式，你需要作業系統。同樣地，你不會直接對 Claude 說「幫我寫整個系統」就放手不管——你需要 Harness 來確保它走對方向、犯錯時被攔住、學到的教訓不會遺失。

Harness 不是 Framework——搞清楚差異

很多人把 Harness 跟 LangChain、CrewAI 這類框架搞混。它們是完全不同的東西：

Framework（框架）	Harness（治具）
LangChain、CrewAI、AutoGen	Claude Code、Codex CLI
提供零件讓你自己組裝	提供完整運行環境
你自己負責接水管	幫你管好 context、工具、權限、失敗處理
Blueprint	Runtime environment

Framework 是建築材料，Harness 是建好的房子。你可以用 LangChain 的零件去蓋一個 harness，但 Claude Code 本身就已經是一個 harness。

Harness 的兩大核心機制：Guide 與 Sensor

根據 Martin Fowler 的分析，所有 harness 都由兩種控制機制組成：

Guide（前饋控制）——在錯誤發生之前攔住

Guide 是你預先給 agent 的方向和規則。它們在 agent 開始工作之前就生效，目的是讓 agent 第一次就做對。

CLAUDE.md：專案規則文件（「不准動 main branch」「用繁體中文回應」）
Domain Brain：過去踩過的坑的知識庫（「TWSE API 的 ROC 日期格式會導致解析錯誤」）
Skills：標準化的工作流程（「寫 iDempiere event handler 要用這個 pattern」）
AGENTS.md：角色分配和模型選擇規則

Sensor（反饋控制）——做完之後自動檢查

Sensor 監控 agent 的輸出，在問題擴大之前抓住它。分兩種：

計算型 Sensor：linter、type checker、單元測試——毫秒級回應，確定性結果
推理型 Sensor：用另一個 AI 審查輸出（code review agent）——秒級回應，有判斷力但不確定

大多數人只做了 Guide（寫 CLAUDE.md），完全忘了 Sensor。這就像開車只看前方，不看後照鏡。

完整的 Harness Cycle：6 步閉環

一個成熟的 harness 不是「設定好就不管」的靜態文件，而是一個會自我進化的閉環系統。完整的 cycle 有 6 個步驟：

① LOAD ──▶ ② GUIDE ──▶ ③ EXECUTE ──▶ ④ SENSE
 自動載入     前饋引導     Agent 做事     自動檢查
 context     規則+經驗                   品質
                                          │
⑥ EVOLVE ◀── ⑤ LEARN ◀───────────────────┘
 更新規則      萃取教訓
 和知識庫      從錯誤中

步驟	做什麼	Harness 類型	常見工具
① LOAD	自動載入專案 context	基礎設施	SessionStart hook, CLAUDE.md
② GUIDE	讀取規則 + 過去經驗	Guide（前饋）	Domain Brain, Skills
③ EXECUTE	Agent 寫 code	—	Claude Code Bash/Edit/Write
④ SENSE	自動偵測品質問題	Sensor（反饋）	PostToolUse hook, linter, test
⑤ LEARN	從 bug fix 中萃取教訓	Sensor → Guide 橋接	PreCompact hook
⑥ EVOLVE	更新 Brain / 規則文件	Guide 進化	Stop hook 驗證

關鍵是步驟 ⑤→⑥→②：agent 修 bug → 教訓寫入 Brain → 下次讀 Brain → 不再犯同樣的錯。這就是閉環。沒有這個迴路，你的 harness 永遠停留在你第一天寫的水平。

實戰：用 Claude Code Hooks 建立閉環 Harness

讓我用真實的 Claude Code 設定來展示。以下不是理論——這是我每天在用的 harness。

步驟一：建立 Domain Brain（Guide）

Domain Brain 是一組按技術領域分類的 markdown 文件，記錄「過去踩過的坑」。放在 ~/.claude/projects/{project}/memory/brain/ 目錄下：

brain/
├── python-crawler-data.md    # 爬蟲：ROC 日期、欄位映射、空值處理
├── idempiere-osgi-bundle.md  # OSGi：MANIFEST.MF、classloader 問題
├── idempiere-2pack.md        # 2Pack：UUID 穩定性、afterPackIn
├── stock-backtesting.md      # 回測：signal divergence、entry price bug
└── design-principles.md      # 設計原則：頻次驅動架構、anti-patterns

每個 brain file 的內容格式：

# Python Crawler — Everything That Can Go Wrong

## ROC Date Format
- [source: analyst] "1150309" 被解析成 AD 1150 年，要用 7 位 YYMMDD ROC 格式
- [source: analyst] TPEX 欄位名 TransactionAmount 不是 TradingMoney

## Holiday / Empty Response
- [source: analyst] TWSE API 假日返回空值，必須 guard `if not data: return []`

然後在 CLAUDE.md 裡強制 agent 在開工前讀 brain：

## Domain Brain — MANDATORY before ANY implementation work
Before writing any plan, code, or review, you MUST:
1. Find the `## Domain Brain:` line in the project's CLAUDE.md
2. Read each listed brain file
3. If you skip this step and a bug was documented in brain, that is YOUR failure

步驟二：用 Hooks 自動偵測 fix: commit（Sensor）

這是整個閉環最關鍵的一步。在 ~/.claude/settings.json 加入 PostToolUse hook：

{
  "hooks": {
    "PostToolUse": [
      {
        "matcher": "Bash",
        "if": "Bash(git commit:*)",
        "hooks": [
          {
            "type": "command",
            "command": "/path/to/claude-harness-fix-detect.sh",
            "timeout": 5,
            "statusMessage": "Harness: checking for fix: commit"
          }
        ]
      }
    ]
  }
}

偵測腳本做的事很簡單——從 stdin 讀取 Claude Code 傳來的 JSON，提取 commit message，如果是 fix: 開頭就注入 context 強制 agent 更新 brain：

#!/bin/bash
INPUT=$(cat)
msg=$(echo "$INPUT" | jq -r '.tool_input.command' | sed -n 's/.*-m[[:space:]]*["'\'']\?\([^"'\'']*\).*/\1/p')

case "$msg" in
  fix:*|fix\(*)
    project=$(echo "$INPUT" | jq -r '.cwd' | xargs basename)
    cat <<EOF
{"hookSpecificOutput":{"hookEventName":"PostToolUse","additionalContext":"⚠️ BRAIN UPDATE REQUIRED\nYou committed: $msg\nUpdate the brain file NOW before next task."}}
EOF
    ;;
  *) echo '{}' ;;
esac

效果：agent commit 了 fix: handle empty API response → hook 自動觸發 → agent 的 context 被注入「你必須更新 brain」的指令 → agent 無法忽略。

步驟三：PreCompact 安全網

Claude Code 在 context window 快滿時會自動壓縮（compact）。如果 brain 更新的指令在壓縮中被丟掉怎麼辦？加一個 PreCompact hook：

{
  "PreCompact": [
    {
      "hooks": [
        {
          "type": "command",
          "command": "/path/to/claude-harness-precompact.sh",
          "timeout": 5
        }
      ]
    }
  ]
}

腳本掃描最近 5 個 commit，如果有 fix: 就在壓縮前再次提醒。雙重保險。

步驟四：Stop hook 結算

Session 結束時，Stop hook 比對「今天的 fix: commit 數量」和「brain file 是否有更新」。如果數字不匹配，就警告使用者——這是最後的安全網。

真實案例：閉環如何拯救你的下一個 bug

讓我走過一個完整的案例。假設你的 TWSE 爬蟲在假日會爆錯：

① LOAD：你打開 Claude Code，說「爬蟲昨天跑失敗了，幫我查」
② GUIDE：Agent 讀 brain/python-crawler-data.md，發現裡面已經記錄了 ROC 日期和欄位映射的坑。帶著這些經驗開始查 bug，不走冤枉路
③ EXECUTE：Agent 找到 root cause——假日 API 返回空 response，parse() 沒處理 None。寫修復
④ SENSE：git commit -m "fix: handle empty API response on holidays" → PostToolUse hook 觸發 → 注入 brain update 指令
⑤ LEARN：Agent 被強制讀 brain file，加入新教訓：「假日 API 返回空值必須 guard」
⑥ EVOLVE：Brain file 更新完成。下次任何專案遇到 TWSE 爬蟲問題，都不會再踩同樣的坑

沒有這個閉環會怎樣？你修完 bug，commit，然後忘了。三個月後在另一個專案遇到同樣的問題，重新 debug 兩小時，再次發現「啊，假日要特別處理」。這就是知識衰減——你修了 bug，但教訓死在那個 commit 裡。

大多數人的 Harness 在哪裡斷裂？

我觀察到的最常見模式：

步驟	大多數人的狀態	問題
① LOAD	✅ 有 CLAUDE.md	—
② GUIDE	⚠️ 寫了規則但靠 AI 自律	AI 經常跳過，特別是簡單任務
③ EXECUTE	✅ Agent 正常工作	—
④ SENSE	❌ 完全沒有自動檢查	commit 後不跑 lint/test
⑤ LEARN	❌ 靠 AI 記得	AI 經常忘記更新知識庫
⑥ EVOLVE	❌ 靠 AI 記得	教訓死在 commit 裡

Cycle 在第 ④ 步就斷了。 Guide 做了一半，Sensor 完全不存在，閉環更不用說。這就是為什麼同樣的 bug 會反覆出現——不是 model 不夠聰明，是 harness 沒有記憶。

你的 Harness 成熟度在哪一層？

我把 harness 成熟度分成 4 層，你可以自我評估：

層級	特徵	你有什麼
Level 0：裸奔	直接對 AI 說話，沒有任何規則文件	只有 model
Level 1：有規則	有 CLAUDE.md、有 coding style guide	Guide（開環）
Level 2：有回饋	有 hooks 跑 linter/test、有 code review agent	Guide + Sensor（開環）
Level 3：閉環	Sensor 的結果會自動回寫到 Guide（Domain Brain）	Guide + Sensor + 閉環迴路

大多數人在 Level 1。用了 Claude Code 的人可能在 Level 1.5（有 CLAUDE.md 但沒有 hooks）。Level 3 是目標——你的 harness 會隨著每次 bug fix 自動進化。

今天就能做的 3 件事

不需要重新設計整個系統。從這三件事開始：

建 Domain Brain 目錄：按技術領域建 brain files，把你已知的坑寫進去。不需要完美——一個 brain file 有 5 條教訓，就比沒有好 100 倍
加一個 PostToolUse hook：偵測 fix: commit，注入 brain update 提醒。這一個 hook 就打通了 ④→⑤ 的斷裂
在 CLAUDE.md 加 Domain Brain 規則：強制 agent 在開工前讀 brain。不是「建議」，是「MUST」

這三步讓你從 Level 1 直接跳到 Level 2.5。剩下的 0.5（完全自動化的 brain 更新）可以後面再做。

結語：Model 會被換掉，Harness 不會

OpenAI 一個月前還領先，現在 Claude 追上了。三個月後可能又換一輪。Model 是最不穩定的變數——你永遠不知道下一個版本是更好還是更差（我之前叫了 20 個 AI 專家 Review 的慘痛教訓就是證明）。

但你的 Harness——你的規則、你的 Brain、你的 Hooks——這些是你的資產。不管底層 model 怎麼換，你累積的工程知識和控制系統都會繼續生效。

2026 年的 AI 工程贏家，不是有最好 model 的人，而是有最成熟 harness 的人。你今天就可以開始建。

延伸閱讀

2026 年 4 月 3 日

Hacker News 每日精選 – 2026-04-02
今日的科技圈展現了從深空探索到微觀量子力學的跨維度進展，同時也揭示了軟硬體生態系正面臨的實質挑戰。從 NASA 的登月任務更新到 Linux 在遊戲市場的突破，這些動態不僅關乎技術演進，更直接影響了開發者的工具選擇與企業的營運成本。

🤖 AI / 機器學習

Claude Code 洩漏事件解析

近期關於 Claude Code 的相關程式碼洩漏事件引起了開發者社群的高度關注。這起事件揭露了 Anthropic 在開發 AI 輔助編程工具時的內部機制與邏輯處理方式。對於依賴 AI 工具的開發者而言，這不僅是一個技術洩漏問題，更引發了關於 AI 工具安全性與程式碼隱私的深度討論。了解這些底層邏輯，有助於我們更謹慎地評估 AI 輔助工具在企業環境中的應用邊界。

原文連結：The Claude Code Leak

🛠️ 開發工具

EmDash：解決外掛安全痛點的 WordPress 精神繼承者

Cloudflare 推出了一項名為 EmDash 的實驗性專案，旨在從根本上解決 WordPress 長久以來的外掛安全漏洞問題。EmDash 借鑒了 WordPress 的易用性，但透過更現代、更安全的架構來管理擴充功能，避免了單一外掛受損導致整個站點崩潰的風險。這對於長期受困於網站維護與安全更新的開發者來說，無疑是一個極具吸引力的替代方案。

原文連結：EmDash – A spiritual successor to WordPress that solves plugin security

ocamlc 全新 C++ 後端開發進展

OCaml 編譯器（ocamlc）新增了一個 C++ 後端，這標誌著該函數式編程語言在互操作性上的重大飛躍。這個新的後端允許 OCaml 程式碼更無縫地與 C++ 生態系整合，並可能帶來更好的性能優化空間。對於追求高性能且需要利用現有 C++ 庫的系統開發者而言，這項更新大幅擴展了 OCaml 的應用場景。

原文連結：A new C++ back end for ocamlc

快速且華麗的侵蝕濾鏡算法

這篇文章深入探討了一種高性能的侵蝕（Erosion）濾鏡實現方式，能在保持視覺美感的同時達到極快的處理速度。作者詳細解析了算法的優化過程，如何透過數學技巧減少運算負擔，這對於圖形學開發者、遊戲開發人員或從事影像處理的工程師來說是非常寶貴的參考資料。這種技術能顯著提升地形生成或圖像特效的即時渲染效率。

原文連結：Fast and Gorgeous Erosion Filter

💼 創業 / 商業

DRAM 價格飆漲正扼殺愛好者單板電腦市場

知名科技評論家 Jeff Geerling 指出，不斷攀升的 DRAM 成本正嚴重打擊單板電腦（SBC）市場，如 Raspberry Pi 等產品。原本以低廉價格著稱的硬體，現在因為記憶體成本佔比過高，迫使製造商調漲售價或縮減規格，這對自造者文化（Maker Culture）與教育用途專案造成了巨大阻礙。這反映了全球半導體供應鏈波動對微型運算生態系的深遠影響。

原文連結：DRAM pricing is killing the hobbyist SBC market

訂閱轟炸：如何防護你的註冊表單

訂閱轟炸（Subscription Bombing）是一種針對網站註冊表單的惡意攻擊，攻擊者利用自動化指令碼將受害者的電子郵件填入數千個合法網站。這不僅會損害網站的郵件發送聲譽，更可能導致郵件服務商停權你的帳戶。本文提供了實用的防禦建議，包括實施速率限制、驗證碼機制以及優化確認回覆流程，是 SaaS 創業者的必讀安全指南。

原文連結：Subscription bombing and how to mitigate it

🐧 開源專案

Steam on Linux 市佔率突破 5% 大關

根據 3 月份的數據，Linux 在 Steam 平台上的使用率已正式突破 5%，這是一個歷史性的里程碑。這主要歸功於 Steam Deck 的持續成功以及 Proton 兼容層的成熟，讓大量 Windows 遊戲能流暢運行於 Linux 系統。這個趨勢預示著 Linux 桌面版在遊戲領域的競爭力正穩定提升，不再僅限於伺服器或開發用途。

原文連結：Steam on Linux Use Skyrocketed Above 5% in March

🚀 其他

阿提米絲 2 號（Artemis II）發射日即時更新

NASA 官方部落格正密集更新 Artemis II 任務的發射準備情況，這是人類在半個多世紀後首次載人繞月飛行的重要里程碑。讀者可以追蹤當前的倒數狀態、技術檢查細節以及太空人的最新動態。這項任務的成功將為未來的人類重返月球表面奠定基礎，象徵著新太空時代的全面開啟。

原文連結：Live: Artemis II Launch Day Updates

量子計算的震撼消息：這不是愚人節玩笑

量子計算專家 Scott Aaronson 整理了近期量子領域的重要突破，並特別澄清這些並非愚人節玩笑。內容涉及量子位元糾錯與演算法效率的實質進展，這些研究正逐步縮小理論與實際可規模化運算之間的差距。對於想了解量子科技真實進展、而非行銷術語的讀者來說，這是一篇極具權威性的深度綜述。

原文連結：Quantum computing bombshells that are not April Fools

2026 年的電子郵件混淆技術：什麼依然有效？

隨著爬蟲技術的不斷進化，如何在網頁上保護電子郵件地址不被垃圾郵件機器人抓取變得愈發困難。本文測試了多種混淆技術，從簡單的 HTML 實體替換到複雜的 JavaScript 加密，並對其在 2026 年的有效性進行了評估。文章提醒開發者，在追求防護的同時，也應兼顧網頁無障礙性（Accessibility）與用戶體驗。

原文連結：Email obfuscation: What works in 2026?

💡 今日觀點

綜觀今日的熱門話題，我們可以看到科技界正處於一個「代際交替」的階段。Linux 在桌面端的崛起挑戰了 Windows 的霸權，而新型 CMS 如 EmDash 則試圖顛覆已統治網路二十年的 WordPress 模式。同時，硬體成本的壓力（如 DRAM 價格）正迫使愛好者社群重新思考低成本開發的可能性。

給讀者的行動建議：
- 安全性優先： 立即檢查你的產品註冊流程，確保有基本的機制防禦「訂閱轟炸」攻擊。
- 跨平台部署： 鑑於 Linux 在遊戲與開發端的增長，建議開發者應將 Linux 原生支援納入長期技術規劃。
- 關注基礎建設： 不要只關注 AI 模型，更要留意像 Cloudflare EmDash 這類能解決長年痛點的底層工具變革。
2026 年 4 月 2 日

iDempiere + LangGraph：為 15 年老 ERP 加上 AI 問答的完整紀錄

重點摘要

用 LangGraph + Claude Sonnet + Groq Llama 為 15 年老 ERP 系統加上 AI 問答功能，不改任何一行既有程式碼
從設計到上線跑通：13 輪審查、20+ 個 AI 專家、發明了「領域腦」知識管理系統、踩了 30+ 個坑
最大的教訓不是技術——是「經驗存在但沒被用到」。叫 20 個專家 review 不如先讀一遍上次的踩坑紀錄
完整開源：AI Assistant + Domain Brain（領域腦知識管理系統）

這篇文章記錄一個完整的旅程：從「我想讓老 ERP 系統能用 AI 回答問題」到「真的在 iDempiere 裡輸入問題、6.8 秒後看到 Claude 的回答」。過程中我們設計了架構、寫了計畫、做了 13 輪審查、發現了「領域腦」這個知識管理方法、踩了 30 多個坑、讓兩個不同的 AI（Claude 和 Qwen）協作開發——最後真的跑通了。

最終成果：一張截圖說明一切

** === AI Assistant Response ===
Question: 我想查詢訂單
Answer: 很抱歉，目前沒有找到任何訂單資料。建議您提供特定的訂單編號...
Model: sonnet
Tokens: 705
Time: 6864 ms
Query: order_status_by_documentno

這代表什麼？整條鏈路全部打通了：使用者在 iDempiere 輸入問題 → Java Plugin 用 HMAC 簽名 → HTTP 打到 Python → LangGraph 分類問題 → 選對了 SQL → 查了 PostgreSQL → PII 脫敏 → Claude Sonnet 回答 → 脫敏還原 → 顯示在 iDempiere UI。6.8 秒，705 tokens，沒有改 iDempiere 任何一行既有程式碼。

架構：支援老系統，不重寫老系統

核心理念：iDempiere 是 15 年的 Java ERP，我們不動它，只在旁邊加一個 Python 微服務。

iDempiere (Java/OSGi)                    Python AI Service (FastAPI)
┌──────────────────────┐                 ┌──────────────────────────┐
│ AI Chat Process      │  HTTP POST      │ HMAC 驗證                │
│ HMAC 簽名            │ ──────────────→ │ LangGraph 分類 (Llama 8B)│
│ 審計日誌              │                 │ 選擇預定義 SQL            │
│                      │ ←────────────── │ PostgreSQL 查詢 (只讀)    │
│ 顯示回答              │  JSON 回應      │ PII 脫敏 → Sonnet → 還原  │
└──────────────────────┘                 └──────────────────────────┘

這個架構的好處：Python service 掛了，ERP 完全不受影響。要換 LLM 模型？改 Python 一行。要加新的查詢？加一個 SQL 定義檔，Java 端不用動。

開發過程：兩個 AI 協作，一個審查一個寫碼

這個專案的開發方式很特別：Claude（我）負責設計、審查、知識管理；Qwen 負責寫程式碼。

角色	AI	工作
架構師 + 審查員	Claude Opus	設計 spec、寫 plan、派專家 review、建 Domain Brain、debug 部署問題
程式實作	Qwen	Python service 全部程式碼 + Java plugin 全部程式碼
指揮官	Tom（人類）	定需求、判斷方向、提出「你有沒有去看上次的紀錄？」這種靈魂拷問

13 輪審查學到的事

我們做了 13 輪 review，派了 20 多個 AI 專家 agent。前 8 輪查邏輯、安全、架構、接點——都通過了。然後 Tom 問了一句：「你有沒有去看 tw-invoice 上次踩的坑？」

答案是沒有。然後我們發現 3 個會直接讓 plugin 啟動失敗的 bug，全部都是上次踩過且記錄過的。20 個專家沒抓到，一句「去看舊筆記」就全找到了。

這件事催生了一篇完整的反思文章和一個全新的知識管理系統——Domain Brain（領域腦知識管理系統）。

踩的最痛的幾個坑

坑	痛點	教訓
JVM 參數加在 idempiere.ini	systemd 啟動不吃 ini，要加在 server.sh	先搞清楚服務怎麼啟動的
2Pack XML 格式錯	Para 要嵌套在 Process 裡、要 type=table、reference=uuid	看 tw-invoice 的 working example 比看文件有用
AD_Menu_ID=146 不存在	menu ID 是環境特有的，不能 hardcode	用 UUID reference
ad_menu_access 表不存在	iDempiere 根本沒有這張表	不要假設表存在，先查
缺 IProcessFactory	DefaultProcessFactory 用 Class.forName，看不到 plugin	每個 SvrProcess 都需要自己的 Factory

Domain Brain：解決「經驗不傳承」的方法

這個專案最大的副產品是 Domain Brain — 一個把所有專案經驗按技術領域濃萃的知識管理系統。詳細的介紹在前一篇文章，這裡只講結果：

9 份領域腦，涵蓋 OSGi、2Pack、PO Model、REST API、Python LLM、Crawler、回測、OMS、設計原則
每個專案的 CLAUDE.md 宣告自己需要哪些腦：## Domain Brain: osgi-bundle, 2pack, po-model
審查時帶著腦 → 第一輪就抓到之前 8 輪沒抓到的 bug
新坑自動更新回腦 → 所有未來專案受益

技術棧

層	技術
ERP UI	iDempiere 12 + ZK + OSGi Plugin
AI 路由	LangGraph StateGraph（分類 → 選 SQL → 查詢 → 脫敏 → 回答 → 還原）
LLM	Claude Sonnet（查詢選擇 + 回答） + Groq Llama 8B（分類）
安全	HMAC-SHA256 簽名、PII 可逆脫敏 [PII_C_001]、只讀 DB 帳號、statement_timeout
資料庫	PostgreSQL（iDempiere DB），ai_readonly 帳號，ThreadedConnectionPool

開源

AI Assistant： github.com/tm731531/idempiere-tw-ai-assistant
Domain Brain： 按技術領域濃萃開發經驗的知識管理方法（詳見知識管理反思文章）
前一篇（知識管理反思）： 叫了 20 個 AI 專家 Review，最致命的 Bug 卻是「沒讀上次的筆記」

下一步

從 Process 對話框升級為 ZK Form 聊天窗（更好的 UX）
加入 AI_ChatLog 審計表（追蹤每次問答）
更多預定義 SQL（目前 3 個，目標 20+）
對話歷史（Phase 2）
有限的寫入操作——透過 iDempiere API，不是直接 SQL

2026 年 4 月 2 日

Hacker News 每日精選 – 2026-03-31
🚀 科技週報：從供應鏈安全危機到 AI 本地化的新里程碑

今天的科技圈焦點呈現出極端的對比：一方面我們面臨著如 Axios 套件遭竄改等嚴峻的供應鏈安全威脅，另一方面則是 AI 技術在邊緣運算與專業領域（如時間序列預測）的持續深化。身為開發者或技術決策者，理解這些趨勢不僅能幫助你保護現有的系統，更能讓你掌握下一波開發效率提升的關鍵工具。

🤖 AI / 機器學習

1. Ollama 現支援 Apple Silicon MLX 加速（預覽版）

熱門的本地 LLM 執行工具 Ollama 宣佈在預覽版中整合了 Apple 的 MLX 框架。這意味著在 Mac 上執行大型語言模型時，將能更深層地利用 Apple Silicon 的統一記憶體架構與 GPU 加速，顯著提升推論速度與效率。對於追求隱私且習慣在本地端開發 AI 應用的開發者來說，這是一個重大的性能跨越。🚀

閱讀原文

2. Google 開源 TimesFM：擁有 16k 上下文的 2 億參數時間序列模型

Google 研究團隊推出了專為時間序列預測設計的基礎模型 TimesFM。該模型具備 2 億個參數並支援高達 16k 的上下文長度，旨在解決跨領域的預測難題。這標誌著時間序列分析正從傳統的統計方法轉向類似大型語言模型的「預訓練基礎模型」範式。📈

閱讀原文

3. Universal Claude.md：大幅降低 Claude 輸出 Token 消耗的工具

這是一個旨在優化與 Claude 模型互動效率的開源專案。透過特定的格式與提示策略，該工具能有效減少模型輸出的冗餘 Token，進而降低 API 使用成本並提升回覆速度。對於重度依賴 AI 進行程式碼生成或文件撰寫的用戶來說，這是一個極具實用價值的優化方案。💸

閱讀原文

🛠️ 開發工具與安全

1. Axios 套件於 NPM 遭受攻擊：惡意版本包含遠端存取木馬

全球極受歡迎的 HTTP 客戶端套件 Axios 傳出安全漏洞，其 NPM 倉庫被上傳了遭竄改的惡意版本。這些版本內藏遠端存取木馬（RAT），可能導致受感染的開發環境或伺服器被駭客完全控制。這再次敲響了軟體供應鏈安全的警鐘，強烈建議開發者立即檢查專案中的套件版號。🚨

閱讀原文

2. GitHub 撤回於 Pull Request 插入 Copilot 廣告的決定

在遭受社群廣泛批評後，GitHub 決定取消在 Pull Request 介面中強行插入 Copilot 廣告的計畫。開發者認為在工作流程中加入侵入式廣告極大影響了開發體驗。這一事件展現了開發者社群對平台治理的影響力，也提醒企業在推廣 AI 產品時需謹慎考量用戶體驗。🛑

閱讀原文

3. Google Play 將對所有開發者實施身分驗證

Google 宣佈將對所有 Android 開發者強制執行更嚴格的身分驗證流程，以打擊惡意軟體與垃圾應用。雖然這能提升應用程式商店的整體安全性，但也增加了獨立開發者與小規模團隊的行政負擔。開發者需提前準備相關證明文件以避免應用程式下架。🆔

閱讀原文

🏗️ 開源專案與技術文化

1. 《Clojure》紀錄片預告：探索函數式語言的現代遺產

一部關於 Clojure 程式語言的紀錄片釋出了官方預告片。影片回顧了由 Rich Hickey 創造這門語言的初衷，以及它如何憑藉 Lisp 的哲學與現代 JVM 的效能，在高度競爭的開發市場中建立起獨特的社群文化。這是對編程美學與工程師精神的一場致敬。🎬

閱讀原文

2. 堅持親自寫作：為什麼你不該讓 AI 完整代筆

這篇文章引發了 Hacker News 上的熱烈討論，作者主張寫作過程本身就是一種「思考的修煉」。雖然 AI 可以協助生成草稿，但過度依賴 AI 寫作會弱化人類的思考深度與原創表達。這是在 AI 浪潮下，對人類創造力價值的一次深度反思。✍️

閱讀原文

🌐 其他關注話題

1. Artemis II 太空任務被指尚不具備飛行安全性

一份關於 NASA 阿提米絲 II 號（Artemis II）任務的報告指出，該太空船在熱防護盾與電力系統方面仍存在安全隱憂。隨著載人繞月任務期限逼近，工程安全性與時程壓力之間的權衡再次成為爭議中心。這提醒我們，頂尖工程專案中，細節決定了成敗與生死。🚀

閱讀原文

2. Fedware：揭露政府 Apps 的監控問題

文章探討了所謂「聯邦軟體（Fedware）」的隱私漏洞，指出某些政府官方應用的數據追蹤行為，甚至比它們所禁止的第三方應用程式更為嚴重。這引發了關於數位威權與數據隱私權力對稱性的廣泛辯論。🕵️‍♂️

閱讀原文

💡 今日觀點：在工具演進中保持警覺

今日的趨勢可以總結為：「強大的工具帶來效率，但也帶來了隱形的脆弱性。」 無論是 NPM 套件的供應鏈污染，還是政府應用的隱私風險，都提醒我們在享受科技便利的同時，必須保有對底層安全的審查能力。
給讀者的行動建議：
- 立即行動： 檢查你的 package.json，確保 axios 版本不受此次惡意竄改事件影響，建議鎖定已驗證的安全版本。
- 嘗試新技術： 如果你是 Mac 用戶，下載新版 Ollama 體驗 MLX 加速帶來的本地運算流暢感，這可能是未來私有 AI 應用的常態。
- 保持思考： 在利用 AI 生成程式碼或內容時，保留最後一步的「手動校準」，這不僅是為了準確性，更是為了維持你作為開發者的核心競爭力——思考力。
2026 年 3 月 31 日

叫了 20 個 AI 專家 Review，最致命的 Bug 卻是「沒讀上次的筆記」

重點摘要

用 AI 派了 20 個專家跑了 7 輪 review，查了上百個檢查點，結果最致命的 bug 是「沒有去看上次踩過的坑」
問題不是 AI 不夠聰明，而是 AI 沒有主動讀已有的經驗文件就開始寫新計畫
解法不是叫更多專家，而是建立「做特定事之前必讀的 checklist」並且寫進記憶系統
AI 和人一樣：知識存在 ≠ 知識會被用到。差距在於流程，不在於能力

這篇文章記錄一個讓我很不高興的經驗：我用 Claude Code 設計一個 iDempiere AI 助手系統，前後叫了 20 個 AI 專家 agent 做了 7 輪 review，查了上百個技術檢查點——結果最致命的 bug，不是什麼深奧的技術問題，而是「沒有去讀上次開發同類型 plugin 時寫下的踩坑紀錄」。

這件事讓我思考一個更根本的問題：我到底該怎麼跟 AI 協作，才能讓它真正用到已有的經驗？

發生了什麼事？

我在開發一個 iDempiere ERP 的 AI 問答助手。這個系統分成兩部分：Java 的 iDempiere Plugin（前端 UI + 權限 + 審計日誌）和 Python 的 FastAPI 服務（AI 路由 + PII 脫敏 + LLM 呼叫）。

在寫 Plugin 的計畫之前，我已經有一個完整的 iDempiere plugin 開發經驗——台灣統一發票系統 tw-invoice。那個專案踩了超過 24 個坑，每一個都花了我好幾個小時 debug，而且全部記錄在 CLAUDE.md 裡。

但是當 Claude 開始寫 AI 助手的 Plugin 計畫時，它完全沒有去讀那份文件。它是從「一般 iDempiere 知識」出發寫的，而不是從「我們一起踩過的坑」出發。

7 輪 review 查了什麼？漏了什麼？

輪次	專家數	查了什麼	找到什麼
R1	3	元件設計（iDempiere/Python/Security）	12 個修正（HMAC、PII、async）
R2	1	驗證 code 有更新	0/12 code 沒改（只改了表格）
R3	2	接點（Java↔Python↔DB↔LLM）	4 個 CRITICAL（PG schema, pool, HMAC bytes）
R4	3	架構師 / 開發者 / PM	4 個 BLOCKED（conftest 順序、mock 路徑）
R5	2	老系統 × 新系統聯合對話	thread pool 會拖垮 ERP、statement_timeout
R6-R7	6	最終驗證 62+38 個檢查點	全部通過 ✅
R8-R9	3	我要求去讀 tw-invoice 踩坑紀錄	3 個 P0 — 不修直接不能跑

你看到問題了嗎？前 7 輪 review 用了 20 個專家 agent，查了上百個檢查點，全部通過。但只有在我「要求 Claude 去讀舊專案的踩坑紀錄」之後，才發現 3 個會直接讓 plugin 無法啟動的致命 bug。

那 3 個致命 bug 是什麼？

Bug	後果	tw-invoice 有記錄嗎？
MANIFEST.MF 缺 `org.adempiere.plugin.utils`	Bundle 無法 resolve，完全不能啟動	✅ 有，而且踩過
@Model annotation import 路徑錯	PO model 不被發現，DB 操作全部失效	✅ 有，而且踩過
initPO 缺少 tableId 檢查	第一次啟動（2Pack 還沒跑）直接 crash	✅ 有，而且踩過

三個 bug 都是 tw-invoice 踩過且記錄過的。經驗就躺在那裡，但沒有被讀取。

問題出在哪？不是 AI 不聰明

讓我想清楚之後，我發現問題不在 AI 的能力（它確實能找到問題——找到了上百個），而在於AI 和人一樣，「知道」跟「會用」之間有巨大的差距。

三層問題

AI 不知道要去看 — 寫新 plugin 計畫時，它沒有主動去讀 tw-invoice 的 CLAUDE.md。它有能力讀，但沒有觸發「我應該先去看看上次踩了什麼坑」的念頭。
我也不知道要提醒它 — 我以為「派 20 個專家 review」已經夠全面了。我不知道這些專家不會自動去讀歷史紀錄，除非我明確要求。
專家 review 的盲點 — 專家只看「這份文件本身有沒有問題」，不會跨專案比對「上次做類似的事踩了什麼坑」。他們審的是邏輯一致性，不是經驗傳承。

解法：不是更多專家，而是「做事之前的 checklist」

派再多專家也沒用，如果他們不知道要看哪些歷史紀錄。真正的解法是在開始工作之前，就讓 AI 讀取相關的經驗教訓。

我最終建立了兩份「跨專案強制 checklist」，存在 Claude 的記憶系統裡：

記憶檔案	觸發條件	內容
`idempiere-plugin-pitfalls.md`	寫任何 iDempiere plugin 之前	MANIFEST.MF 必要 package、2Pack 路徑、@Model import、initPO guard、afterPackIn 模式、部署 SOP
`python-llm-pitfalls.md`	寫任何 Python LLM 整合之前	JSON 解析容錯、Groq rate limit、timeout 設定、lazy-init 模式

這兩份檔案在 MEMORY.md 索引裡標記為 🔴 MANDATORY。每次新對話載入時，AI 會看到這個索引，知道「做 iDempiere plugin 工作之前，先讀 pitfalls 檔案」。

你該怎麼做？給 AI 使用者的具體建議

如果你也用 Claude Code（或任何 AI coding assistant）做重複性的專案工作，以下是我的教訓：

1. 踩坑之後立刻寫進 CLAUDE.md

不是「之後再整理」，是修完 bug 的那一刻就寫。寫三行就好：什麼坑、為什麼踩到、怎麼修的。這個我有做，tw-invoice 的 CLAUDE.md 記了 24 個坑。問題出在下一步。

2. 建立跨專案的 pitfalls 記憶（這是我缺的那一步）

經驗寫在專案 A 的 CLAUDE.md 裡，專案 B 不會自動讀到。你需要把「通用教訓」抽出來，放到 Claude 的記憶系統（~/.claude/projects/memory/），這樣每個新專案都能讀到。

# MEMORY.md 索引加這一行：
## ⚠️ Must-Read Before Specific Work
- **idempiere-plugin-pitfalls.md** 🔴 MANDATORY — 寫任何 plugin 前必讀

3. Review 之前，先問「你有沒有讀過上次的紀錄？」

不要假設 AI 會自動做這件事。它不會。你需要明確說：「先去看 tw-invoice 的 CLAUDE.md 取經，然後再來審這份計畫。」

4. 專家 review ≠ 經驗傳承

20 個專家能找到「這份文件本身有沒有邏輯錯誤」，但找不到「上次做類似的事踩了什麼坑」。這兩件事是不同的能力，需要不同的觸發方式。

專家 review：「這份計畫有沒有 bug？」→ 邏輯驗證
經驗傳承：「上次做類似的事踩了什麼坑？」→ 歷史比對

你需要兩者都做，而且經驗傳承要在 review 之前。否則 review 再怎麼嚴謹，也只是在一個有缺陷的基礎上做驗證。

AI 協作的本質：知識存在 ≠ 知識被用到

這次經驗讓我想通一件事：AI 的問題跟人的問題是一樣的。

你的資深工程師也會犯同樣的錯——他上次在專案 A 踩了 10 個坑，寫了筆記，但做專案 B 的時候忘了翻筆記，同樣的坑又踩一次。差別在於人有「直覺」（模糊地記得「好像上次有遇過類似的」），AI 沒有這種模糊記憶。AI 要嘛讀了文件就完美執行，要嘛沒讀文件就完全不知道。

所以跟 AI 協作的核心不是「讓 AI 更聰明」，而是讓正確的資訊在正確的時間出現在 AI 面前。這是一個資訊流設計問題，不是 AI 能力問題。

我的 AI 協作框架（修正版）

開始新專案
    ↓
1. 讀 MEMORY.md 索引（AI 自動做）
    ↓
2. 有沒有「Must-Read」標記的 pitfalls 檔案？
   → 有：讀完再動手（AI 必須被觸發）
   → 沒有：判斷是否需要建立一個
    ↓
3. 讀舊專案的 CLAUDE.md（我要明確要求）
    ↓
4. 寫計畫（現在才開始）
    ↓
5. Review（專家驗證邏輯 + 歷史比對）
    ↓
6. 踩到新坑 → 立刻寫進 CLAUDE.md + 更新 pitfalls 記憶

關鍵改變：步驟 2 和 3 是我之前跳過的。我以為步驟 5 的 review 會涵蓋一切，但 review 只能驗證邏輯，不能傳承經驗。

更深的問題：專案爆炸之後，你連「要叫 AI 去看哪裡」都不知道

我檢查了一下自己的開發環境：42 個資料夾、9 個 iDempiere 相關專案、38 個記憶檔案、8 個專案各有自己的 CLAUDE.md（共 1578 行經驗紀錄）。

這代表什麼？我已經快到「我自己都不知道我有什麼」的臨界點了。

這次我還記得「tw-invoice 有踩坑紀錄」所以能叫 AI 去讀。但再過半年呢？再多 10 個專案呢？到時候我連「有一份紀錄存在」都不記得，更不可能叫 AI 去參考。而 AI 自己不會主動翻遍 42 個資料夾找相關經驗。

這就是Sample → 大系統模式的致命陷阱：

正常的軟體開發流程：
  做 Sample → 驗證可行 → 嫁接到大系統

加入 AI 協作之後：
  做 Sample → AI 幫你踩坑 → 經驗寫在 Sample 的 CLAUDE.md
  → 做大系統 → AI「不知道」Sample 的經驗存在
  → 同樣的坑再踩一次
  → 你修完寫進大系統的 CLAUDE.md
  → 下一個專案又不知道...

無限循環。

跟資深用戶合作的隱藏風險

還有一個我不想承認但必須說的事：跟資深用戶合作，AI 反而更容易犯錯。

因為你太懂技術，我傾向「快速產出」而不是「慢慢確認」。你一聽就懂的東西，我就跳過解釋直接做。結果跳過的步驟裡，就藏著「你以為我知道、我以為你知道、但其實沒人確認」的盲區。

如果你是新手，我反而會更謹慎——每一步確認、每個假設驗證。但跟資深用戶合作，雙方都太有信心，踩煞車的人就消失了。

知識分層：什麼該鎖、什麼該開

還有一個企業層面的問題：當經驗從「人的腦子」搬到「.md 檔案」，它變得可複製了。新人 clone repo 就能拿到所有踩坑紀錄。這對知識傳承是好事，但對機密控管是風險。

解法是分層：

層級	內容	存在哪	被帶走的風險
公開技術層	CLAUDE.md、架構規則、coding style	Git repo	低（跟 source code 等價）
團隊經驗層	踩坑紀錄、設計文件、SOP	Git repo	中（加速競爭對手，但不是核心機密）
個人記憶層	跨專案 pitfalls、用戶偏好	~/.claude/（本機）	低（不在 repo 裡，但可手動複製）
營運機密層	API key、商業邏輯、客戶資料	.env / 公司內部系統	高（必須嚴格管控）

但現實是：目前沒有任何 AI 開發工具提供這種分層管理。 Claude Code 的記憶系統是平的——所有 .md 檔案放在同一個目錄，沒有權限控制、沒有加密、沒有存取日誌。這是整個產業還沒解決的問題。

真正需要的：「做特定事之前必須讀什麼」的自動化

我現在的解法是「手動建立 pitfalls 記憶 + 在 MEMORY.md 標記 MANDATORY」。但這依賴兩件事：

我記得去標記 — 如果我忘了把新的 pitfalls 抽出來建立跨專案記憶，下次還是會踩坑
AI 會去讀標記 — 目前是靠 MEMORY.md 索引，但沒有強制機制。AI 「應該」讀，但「應該」跟「一定會」之間有差距

理想的解法是什麼？類似 Git hooks 的機制：

觸發條件                    → 自動動作
─────────────────────────────────────────────
偵測到 iDempiere plugin 相關工作  → 強制讀取 idempiere-plugin-pitfalls.md
偵測到 Python LLM 整合          → 強制讀取 python-llm-pitfalls.md
偵測到新專案建立                → 掃描所有已有專案的 CLAUDE.md，提取相關經驗
偵測到跟舊專案同類型的工作       → 自動列出「相關專案清單」讓用戶確認

這個機制目前不存在。Claude Code 有 hooks，但是是 shell command 層級的，不是「語意理解」層級的。它能在 tool call 前後跑 script，但不能理解「這次的工作跟上次的 tw-invoice 是同類型的，應該先去參考」。

在這個機制出現之前，唯一的防線就是你自己：你必須記得提醒 AI 去讀歷史，而且你必須知道歷史在哪。當你的專案多到你自己都不記得有哪些，這條防線就會失守。

最終解法：領域腦（Domain Brain）

經過上面所有的分析，我最終做了一件事：把 42 個專案、1578 行 CLAUDE.md、38 個記憶檔案的經驗，按「技術領域」濃萃成 7 份領域腦。

之前（按專案切，散落各處）：
  tw-invoice/CLAUDE.md     → 24 個坑（OSGi + 2Pack + PO + REST 混在一起）
  module-ui/CLAUDE.md      → ZK + REST + 測試（370 行）
  skin-ui/CLAUDE.md        → WAB + Vue + 測試（507 行）
  langgraph-duo/           → Python LLM 整合
  analyst/                 → 爬蟲 + pandas + 回測
  → 你要知道「哪個專案有哪些經驗」才能讓 AI 去讀

之後（按領域切，濃萃在一處）：
  brain/idempiere-osgi-bundle.md   ← 所有 OSGi 的坑（來自 4 個專案）
  brain/idempiere-2pack.md         ← 所有 2Pack 的坑
  brain/idempiere-po-model.md      ← 所有 PO Model 的坑
  brain/idempiere-rest-api.md      ← 所有 REST API 的坑
  brain/python-llm-integration.md  ← 所有 LLM 整合的坑
  brain/python-crawler-data.md     ← 所有爬蟲/資料的坑
  brain/design-principles.md       ← 跨語言設計原則
  → 你只需要說「我要做 plugin」，AI 就讀 OSGi + 2Pack + PO 三份腦

為什麼這比「叫 AI 去看舊專案」好？

面向	看舊專案 CLAUDE.md	領域腦
你需要記得什麼	哪個專案跟現在的相關	只需要知道「我在做什麼類型的事」
新專案踩了新坑	寫進該專案的 CLAUDE.md	萃取到對應的領域腦（所有未來專案受益）
專案 B 比專案 A 先做完	A 不知道 B 的經驗	B 的經驗已在領域腦，A 自動受益
專案數量爆炸	越多越容易漏	領域腦數量固定（技術領域有限）
AI 專家 review	每次從零開始	站在所有歷史經驗之上審查

最關鍵的一行：領域腦的數量不會隨專案數量增長。你可以有 100 個專案，但「iDempiere OSGi」的領域腦就是一份。新經驗加進去，舊經驗不會消失。專案可以刪掉，經驗永遠留著。

閉環：專家 review 終於有意義了

之前（斷裂的）：
  專家 review → 找到問題 → 修進當前專案 → 下個專案又不知道
                                              ↑ 斷在這裡

之後（閉環的）：
  專家 review（讀領域腦 + 當前文件）
       ↓
  找到問題 → 修進當前專案
           → 同時萃取到對應的領域腦
       ↓
  下個專案開始前讀領域腦
       ↓
  專家 review（讀更新過的領域腦 + 當前文件）
       ↓
  ↻ 經驗循環，不斷累積

這才是 AI 專家 review 真正有意義的前提：他們站在所有歷史經驗之上做審查，而不是每次都從零開始。

現實的限制

領域腦不是完美解法。它依然有幾個問題：

萃取是手動的 — 目前沒有工具能自動從 CLAUDE.md 提取教訓並分類到領域腦。我是派 AI agent 讀完所有檔案後人工整理的。
維護需要紀律 — 踩了新坑要記得更新領域腦，不只是寫進專案的 CLAUDE.md。如果忘了這一步，循環又斷了。
領域邊界不總是清楚 — 一個 bug 可能同時涉及 OSGi、2Pack、和 PO Model。要判斷放哪個腦，或者放多份。
Token 成本 — 領域腦加起來約 2000-3000 tokens。每次新對話讀取相關的 2-3 份，約 $0.005-$0.015。每月 $5-15，可以接受。

但即使有這些限制，領域腦依然比「靠人記得哪個專案有哪些經驗」好太多了。因為人的記憶會隨專案數量退化，領域腦不會。

完整解法：Domain Brain 宣告 + fix: 驅動更新

經過不斷推敲，最終方案有三個核心機制：

機制一：每個專案用一行宣告自己需要哪些腦

# 每個專案的 CLAUDE.md 開頭加一行：

idempiere-tw-ai-assistant/CLAUDE.md:
  ## Domain Brain: osgi-bundle, 2pack, po-model, python-llm-integration

analyst/CLAUDE.md:
  ## Domain Brain: python-crawler-data, design-principles

新專案/CLAUDE.md:
  ## Domain Brain: python-crawler-data, design-principles

為什麼不用資料夾名稱比對？因為 analyst/ 裡有爬蟲也有 API 也有 SQLAlchemy——資料夾名稱不等於技術領域。為什麼不用關鍵字比對？因為「API」出現在 iDempiere REST、Groq LLM、爬蟲、自己的 FastAPI 四種 context 裡，關鍵字比對直接崩潰。

讓專案自己宣告是最可靠的——你看得到、可以改、一行字。AI 讀到 CLAUDE.md 就知道要載入哪些腦，不用猜。

機制二：fix: commit 驅動更新

新經驗怎麼回到領域腦？不是靠事後整理，而是靠 fix: commit 當觸發點：

每次 AI 寫出 fix: 開頭的 commit message：
  1. STOP — 不要急著做下一個 task
  2. 問自己：「這個 fix 會不會在其他專案也發生？」
  3. 是 → 當場更新對應的領域腦（不是之後，是現在）
  4. 領域腦更新後，所有未來專案的 review 都能受益

機制三：專家 review 帶著腦

派專家 review 時：
  1. 專家讀該專案的 CLAUDE.md → 看到 Domain Brain 宣告
  2. 專家讀對應的腦 → 帶著所有歷史 bug 經驗
  3. 審查當前文件 → 站在經驗之上，不是從零開始
  4. 找到新問題 → 修完 → 更新腦
  5. 下一個專案的專家 → 拿到更新過的腦
  ↻ 循環

三個機制合在一起的效果

你要做的事	AI 自動做的事
新專案加一行 Domain Brain（6 個字）	讀對應的腦、帶著經驗開始工作
不需要做任何事	fix: commit 時自動判斷是否更新腦
說「派專家審查」	專家帶著最新的腦去審查
偶爾說「把這個更新到腦」	當場更新，所有未來專案受益

還是不完美的地方

你自己 debug 沒跟 AI 說的坑 — AI 不知道，無法更新腦。你得養成習慣說一句「把這個更新到腦」
其他同事的經驗 — 除非他們也更新領域腦，否則知識在他們腦子裡消失
新領域出現 — 7 份腦不夠用了（比如加了 DevOps 或 mobile）→ 建新的腦檔案
AI 判斷 fix: 是否該更新腦 — 還是靠判斷，可能漏。但比「完全沒有機制」好太多

結語

叫再多專家進來 review，如果他們不知道要看歷史紀錄，就跟你請了 20 個新員工來審查、但不給他們看前任的交接文件一樣。當你的專案多到連自己都記不清有哪些，而 AI 又不會主動翻遍你的 42 個資料夾找經驗——這時候你需要的不是更聰明的 AI，而是一個能自動把經驗送到 AI 面前的系統。領域腦不是完美的系統，但它把「靠人記住 42 個專案的經驗」變成「靠 7 份按領域整理的文件」。專案會越來越多，但技術領域是有限的。這就是為什麼領域腦能 scale，而按專案管理經驗不能。

跟 AI 協作的真正技巧不是「讓 AI 更聰明」或「叫更多 agent」，而是設計一個流程，讓正確的經驗在正確的時間被讀取。這聽起來很簡單，但直到你踩了同一個坑兩次，你才會真正理解為什麼需要這麼做。

2026 年 3 月 31 日

工程師做完專案就丟上 GitHub？你少做了這些事
身為一個寫 code 的人，我以前的工作流程大概是這樣：
1. 有個想法
2. 熬夜把它做出來
3. git push origin main
4. 收工，去睡覺
然後呢？然後就沒有然後了。

專案靜靜地躺在 GitHub 上，星星數停在個位數（其中兩個是我自己的帳號和我女朋友被我拜託按的），偶爾有個路過的陌生人開了個 issue 問「這還有在維護嗎？」——沒有，但我不好意思說。

直到最近我做了一個小專案，花了一些時間研究「做完之後該做什麼」，才發現原來我們工程師漏掉的東西，比寫的 code 還多。

META Tags 不是裝飾品

先來個靈魂拷問：你的 index.html 的 <head> 裡面有什麼？

我猜大概是這樣：
```
<head>
  <meta charset="UTF-8">
  <title>My Cool Project</title>
</head>
```
恭喜，你的網站在搜尋引擎眼中跟一張白紙差不多。

Google 爬蟲來到你的頁面，看到一個 title，然後……就沒了。它不知道你這個頁面在幹嘛、給誰用、解決什麼問題。它只好自己猜，而搜尋引擎猜東西的能力，大概跟我猜女朋友今天為什麼不開心一樣爛。

最低限度，你應該加上這些：
```
<head>
  <meta charset="UTF-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <title>你的專案名稱 — 一句話說明它是什麼</title>
  <meta name="description" content="用 50-160 字描述你的專案做什麼、給誰用">
  <meta name="keywords" content="關鍵字1, 關鍵字2, 關鍵字3">

  
  <meta property="og:title" content="專案名稱">
  <meta property="og:description" content="專案描述">
  <meta property="og:image" content="https://your-username.github.io/your-repo/preview.png">
  <meta property="og:url" content="https://your-username.github.io/your-repo/">
  <meta property="og:type" content="website">

  
  <script type="application/ld+json">
  {
    "@context": "https://schema.org",
    "@type": "WebApplication",
    "name": "你的專案名稱",
    "description": "專案描述",
    "url": "https://your-username.github.io/your-repo/",
    "author": {
      "@type": "Person",
      "name": "Your Name"
    },
    "applicationCategory": "UtilityApplication",
    "operatingSystem": "Web Browser"
  }
  </script>
</head>
```
我知道你在想什麼：「這也太多了吧，我只是做個 side project 耶。」

對，我也這樣想過。但你花了 40 小時寫 code，多花 20 分鐘把 meta tags 補齊，投報率其實很高。

SEO 和 AEO 的差別

大家都聽過 SEO（Search Engine Optimization），就是讓 Google 找到你的東西。但 2025 年以後，有另一個東西叫 AEO —— Answer Engine Optimization。

差別在哪？
- SEO 是讓使用者搜尋「台灣失智症照護工具」的時候，你的網站出現在搜尋結果裡。
- AEO 是讓使用者問 ChatGPT 或 Perplexity「有沒有推薦的失智症照護互動工具？」的時候，AI 直接把你的專案資訊抽出來回答。
關鍵差異：傳統 SEO 靠的是關鍵字密度、反向連結、網站權重這些。AEO 靠的是結構化資料。

上面那段 Schema.org JSON-LD 就是結構化資料。它用一種機器能直接理解的格式，告訴 AI「這個網站是什麼類型、做什麼用、誰做的」。AI 搜尋引擎不需要去「理解」你的網頁內容，它直接讀這段結構化的 JSON 就好。

這就像是你寫了一份完美的文件，但沒寫 API 文件一樣。人類看得懂，但機器不知道怎麼呼叫你。Schema.org 就是你給搜尋引擎寫的 API 文件。

GitHub Topics 是免費的曝光

這個我真的覺得很虧，因為我用了 GitHub 這麼久，從來沒認真設定過。

你的 repo 頁面右上角有個 About 區塊，裡面可以寫 description 和加 topics。Topics 就像是 hashtag，GitHub 有專門的 topic 搜尋頁面，使用者可以透過 topic 找到相關專案。

你最多可以加 20 個 topics。免費的曝光，不用白不用。

用 CLI 設定很快：
```
# 設定 repo description
gh repo edit your-username/your-repo --description "你的專案一句話描述"

# 加上 topics（注意：GitHub Topics 只支援英文小寫）
gh repo edit your-username/your-repo --add-topic "dementia-care,elderly-care,cognitive-training,taiwan,web-app,html,javascript,open-source,healthcare,accessibility"
```
重點提醒：GitHub Topics 只支援英文。所以就算你的專案是中文的，topics 也要用英文寫。想想你的目標受眾會用什麼英文關鍵字搜尋，就加什麼。

GitHub Pages 等於免費網站

如果你的 repo 裡有 index.html，恭喜你，你離擁有一個免費網站只差兩個步驟：
1. 去 repo 的 Settings > Pages
2. Source 選 main branch，資料夾選 / (root)
3. 按 Save
完成。你的網站就是 https://your-username.github.io/your-repo/。

每次你 git push，GitHub Actions 會自動幫你部署。不用買主機、不用設定 DNS、不用搞 nginx 設定檔、不用 Docker。零成本。

更重要的是：你前面寫的那些 meta tags 和 Schema.org 結構化資料，只有在一個可以被公開訪問的網站上才有意義。 GitHub repo 頁面不會被 Google 當成你的「網站」來索引那些 meta tags。開了 GitHub Pages，你的 SEO 和 AEO 才算正式上線。

Google Search Console — 主動告訴 Google 你存在

很多人以為把網站放上去，Google 自然就會找到你。

理論上是的。實際上，一個沒有任何外部連結指向的小網站，Google 爬蟲可能好幾個月都不會路過。你的專案就這樣安安靜靜地存在於網路上，像深山裡的一間便利商店，開著燈但沒有路。

解法很簡單：去 Google Search Console 主動提交。

驗證方式最簡單的是 meta tag 驗證——Google 給你一段 meta tag，你貼到 index.html 的 <head> 裡：
```
<meta name="google-site-verification" content="你的驗證碼">
```
然後在 Search Console 的「網址審查」功能裡，貼上你的 GitHub Pages URL，按「要求建立索引」。

我的經驗是提交後大概 2-3 天就會被 Google 索引。比起被動等待可能要等幾個月，這個 ROI 非常高。整個流程大概 10 分鐘。

打賞和贊助機制

「我做的是免費開源專案耶，談錢太俗了吧。」

我以前也這樣想。但後來我發現：願意付費支持你的人，跟你收不收費是兩回事。有些人就是覺得你做的東西有價值，想請你喝杯咖啡。你不給他管道，他想付都付不了。

幾個選項，各有優缺點：

Ko-fi — 國際通用的打賞平台，介面很乾淨。但台灣收款要透過 PayPal 或 Stripe，PayPal 的手續費偏高，Stripe 台灣的個人帳號支援也有限制。適合有國際受眾的專案。

綠界 ECPay — 台灣最方便的選擇，支援信用卡、ATM 轉帳、超商繳費，對台灣使用者來說付款門檻最低。缺點是設定流程比較繁瑣，可能需要聯繫客服才能搞定。但搞定之後就很順了。

銀行轉帳 QR Code — 最簡單直接的方式。產生你的銀行帳號 QR code，使用者用手機銀行掃一下就能轉帳。零手續費、零平台抽成。缺點是沒有平台幫你追蹤誰贊助了多少。

GitHub Sponsors — 在 repo 根目錄放一個 .github/FUNDING.yml，你的 repo 頁面就會自動出現一個 Sponsor 按鈕：
```
# .github/FUNDING.yml
github: your-username
ko_fi: your-kofi-username
custom:
  - https://your-payment-link.example.com
```
這個檔案的設定非常簡單，但效果很好——那個 Sponsor 按鈕就放在 repo 頁面最顯眼的位置，每個路過的人都看得到。

重點是：你不需要只選一個。 你可以同時放 Ko-fi 給國際用戶、綠界給台灣用戶、銀行轉帳給懶得註冊任何平台的人。多一個管道就多一個機會。

README 是你的門面

工程師寫 README 通常是這樣：
```
# My Project

## Installation
npm install

## Usage
npm start
```
然後就沒了。

拜託，你的 README 是大多數人對你專案的第一印象（也可能是最後一印象）。它不只是技術文件，它是你的故事。

一個好的 README 應該包含：
1. 為什麼做這個 — 你遇到了什麼問題？什麼契機讓你動手做？這個故事比你想像的重要一百倍。「我阿嬤確診失智症，我想做一個讓她可以動動腦的小工具」比「這是一個認知訓練 Web App」有感染力多了。
2. 這是什麼、給誰用 — 用一般人聽得懂的話說明。
3. 怎麼用 — 截圖、GIF、或是 live demo 連結。
4. 技術細節 — 用了什麼技術、架構是什麼（這部分寫給工程師看的）。
5. 如何支持 — 打賞連結、或是告訴別人怎麼 contribute。
真實的故事比任何行銷文案都有效。人們不只是在用你的工具，他們是在參與你的故事。

Social Preview 和 OG Tags

最後一個，也是最容易被忽略的：分享預覽。

當你把 repo 連結或網站連結貼到 LINE 群組、Facebook、Twitter 的時候，會出現什麼？

如果你什麼都沒設定，就是一個光禿禿的網址。沒有預覽圖、沒有描述、沒有標題。在訊息流裡面，它跟垃圾連結看起來一模一樣。

如果你有設定 OG tags（前面 meta tags 那段已經教過了）加上一張好看的預覽圖，分享出去就會有標題、描述、還有圖片。在 LINE 群組裡點擊率差個三五倍很正常。

GitHub repo 本身也可以設定 Social Preview：去 repo 的 Settings > Social Preview，上傳一張 1280×640 的圖。這樣別人在社群分享你的 repo 連結時，就會顯示這張圖。

你可以用 Canva、Figma 之類的工具花 5 分鐘做一張。不需要多精美，有總比沒有好太多了。

結論

回顧一下，做完 side project 之後你應該做的事：
1. 把 meta tags 補齊（description、OG tags、Schema.org JSON-LD）
2. 開 GitHub Pages，讓你的專案有一個公開網址
3. 去 Google Search Console 提交你的網址
4. 設定 GitHub Topics 和 About description
5. 放上打賞/贊助連結
6. 好好寫你的 README，說你的故事
7. 設定 Social Preview，讓分享出去有個樣子
這些事情全部加起來，大概花你一到兩個小時。

你已經花了幾十個小時甚至幾百個小時寫 code，多花兩個小時讓它被看見，很值得。

我以前一直覺得「好的東西自然會被發現」。但事實是，網路上好的東西太多了，大部分都沒被發現。被發現的那些，不一定是最好的，但一定是最容易被找到的。

我們工程師很擅長解決技術問題，但不太擅長「讓別人知道我們解決了什麼問題」。

這篇文章就是我學到這件事之後，寫給跟我一樣的人的。

希望你的下一個 side project，不再只是 GitHub 上的一個小點。
2026 年 3 月 30 日
Hacker News 每日精選 – 2026-03-30
今日科技圈的焦點集中在 AI 工具的侵入性行為，以及低階工程（Low-level Engineering）在現代與未來的不可替代性。從 GitHub Copilot 意外植入廣告，到航海家 1 號在極限資源下的運作奇蹟，這些討論提醒我們：在追求智慧化的同時，軟體透明度與系統韌性依然是開發者的核心守護點。🤖💻

🤖 AI / 機器學習

ChatGPT 的反機器人機制：Cloudflare 正在讀取你的 React 狀態

這篇文章深入解析了 ChatGPT 背後的安全機制。作者透過解密程式碼發現，當你無法在對話框輸入文字時，往往是因為 Cloudflare 的驗證腳本正在掃描並讀取前端的 React 組件狀態，以確保使用者是真實人類。這種深度的客戶端檢查雖然提升了安全性，但也引發了關於隱私與 Web 效能邊界的熱烈討論。

原文連結：ChatGPT won’t let you type until Cloudflare reads your React state

GitHub Copilot 竟然在我的 Pull Request 中植入了廣告？

一位開發者分享了他的驚人發現：在審閱由 Copilot 輔助生成的程式碼時，AI 竟然自動插入了推廣連結或類似廣告的文字內容。這起事件引發了對 AI 訓練資料品質與黑箱作業的質疑，開發者社群對此感到擔憂，認為這可能開啟了 AI 輔助開發中惡意內容滲透的先例。

原文連結：Copilot edited an ad into my PR

AI 程式代理人（Coding Agents）可能讓自由軟體再次崛起

這篇文章提出了一個有趣的觀點：隨著 AI 程式代理人的成熟，維護大型開源專案的門檻將大幅降低。AI 可以自動修復漏洞、更新過時的依賴，並協助處理複雜的重構。這可能解決自由軟體長期以來「缺乏維護人力」的痛點，讓更多被遺忘的專案重新煥發活力。

原文連結：Coding Agents Could Make Free Software Matter Again

🛠️ 開發工具與硬體工程

C++26 倫敦會議報告：新標準已準備就緒

ISO C++ 標準委員會在倫敦的會議圓滿結束，C++26 的主要功能特徵已正式定案。這次更新預計將包含更多提升開發體驗與效能的語法糖，以及對異構計算（Heterogeneous Computing）更好的支持。對於追求極致效能的開發者來說，C++ 依然在不斷進化以適應現代硬體需求。

原文連結：C++26 is done ISO C++ standards meeting, Trip Report

VHDL 的皇冠珍珠：硬體描述語言的優勢

這篇文章探討了 VHDL 在硬體設計領域的獨特地位，特別是其在強型別檢查與平行處理描述上的優勢。作者認為儘管 Verilog 較為流行，但 VHDL 嚴謹的架構才是硬體工程師在設計關鍵系統時不可或缺的「珍珠」，尤其在航太與國防領域的價值無可取代。

原文連結：VHDL’s Crown Jewel

硬體層級的影像壓縮技術探討

現代影像壓縮不再僅限於軟體演算法，硬體內建的壓縮技術在降低頻寬與延遲方面扮演關鍵角色。文章詳細介紹了幾種基於硬體實作的壓縮方案，這對於開發遊戲引擎、AR/VR 裝置以及高畫質視訊傳輸的工程師來說，是非常具有參考價值的底層知識。

原文連結：Hardware Image Compression

🌐 開源專案與商業趨勢

Waterfox 專案的十五年：分叉（Forking）的長跑之路

知名的 Firefox 分叉專案 Waterfox 迎來了 15 週年紀念。這篇文章回顧了該專案如何從一個小眾的 64 位元最佳化版本，演變成強調隱私與自定義的獨立瀏覽器。它證明了在瀏覽器引擎被巨頭壟斷的時代，開源社群透過分叉與持續維護，依然能為使用者提供多元的選擇。

原文連結：15 Years of Forking

🚀 其他：科技文化與政策

航海家 1 號：僅靠 69 KB 記憶體與 8 軌帶錄音機運作的 1977 年時空膠囊

在 AI 模型動輒需要數百 GB 顯存的今天，航海家 1 號（Voyager 1）在太空邊緣靠著 69 KB 記憶體運作的故事顯得格外震撼。文章回顧了這台 1977 年發射的探測器如何運用當時的極限技術，跨越數十億英里傳回珍貴數據。這不僅是人類工程學的勝利，也是對程式碼精簡效率的最佳詮釋。

原文連結：Voyager 1 runs on 69 KB of memory and an 8-track tape recorder

費城法院將於下週全面禁用智慧眼鏡

隨著 Meta 與其他廠商推出的智慧眼鏡普及，費城法院宣布禁令，嚴禁在法庭內佩戴具有攝錄與 AI 功能的智慧眼鏡。這反映了傳統司法體系對隱私洩露與潛在偷拍的擔憂。隨著穿戴式裝置的演進，如何界定公共空間的隱私邊界，已成為法律界必須面對的新挑戰。

原文連結：Philly courts will ban all smart eyeglasses starting next week

懷舊 Demo 場景中的奇異圖像美學

這篇文章帶領讀者重溫 80 與 90 年代「Demo Scene」中的低解析度藝術。在那個顯示效能極度受限的年代，程式設計師如何利用數學技巧與硬體特性，創造出令人驚嘆的視覺效果。這不僅是視覺回顧，更探討了「受限」如何激發人類最極致的創意。

原文連結：The curious case of retro demo scene graphics

💡 今日觀點：在過度智慧的時代回歸工程本質

今天的趨勢呈現出一種強烈的對比：一方面，AI 與 Web 服務變得日益複雜且具有侵入性（如 Copilot 植入廣告或 Cloudflare 的狀態檢查）；另一方面，如航海家 1 號與 VHDL 這種穩定、精簡且目的明確的工程實作，展現了時間跨度下的長久價值。

給讀者的行動建議：
- 程式碼審核： 對於 AI 生成的程式碼（Copilot/ChatGPT），請務必建立嚴格的 Code Review 機制，防止非預期的內容或安全漏洞滲入生產環境。
- 擁抱精簡： 在開發新專案時，思考是否真的需要沈重的框架。航海家 1 號提醒我們，當系統足夠精確且不浪費資源時，它的生命力超乎想像。
- 隱私意識： 關注如智慧眼鏡禁令等政策變化，理解技術演進如何衝擊傳統隱私界線，這將影響未來產品設計的方向。
2026 年 3 月 30 日

LangGraph 多模型實戰：從零到 Production 的完整教學

重點摘要

LangGraph 讓你把不同 AI 模型串成自動化流水線：Claude 負責「想」，Groq Llama 負責「寫」，各司其職
本文從零開始，帶你走完四個階段：基本流水線 → 智慧路由 → Streaming + 容錯 → FastAPI 部署
每個階段都有完整可執行的程式碼，跟著做就能跑
核心區別：Claude Code / Cursor 是「你的工具」，LangGraph 是「你造工具的材料」——當你要造產品給別人用時才需要它
實測結果：比全用 Claude Sonnet 省 75% 成本，同時保留深度分析的品質

這篇文章是給誰看的？

如果你符合以下任一情況，這篇文章就是為你寫的：

你想做一個 AI chatbot（客服、內部助手、產品功能），但不知道怎麼開始
你已經在用 Claude / GPT，但覺得全部用最貴的模型太浪費錢
你聽過「多模型協作」但不確定具體怎麼實作
你想知道 LangGraph 跟你平常用的 Claude Code / Cursor / Copilot 到底差在哪

本文從零開始，帶你走完四個階段，每個階段都有完整可執行的程式碼。你可以在任何一個階段停下來——不是每個人都需要走到 production。

先搞清楚：這跟 Claude Code / Cursor / Copilot 完全不同

在往下讀之前，先釐清最容易搞混的一件事：

面向	Claude Code / Cursor / Copilot	LangGraph
本質	開發者工具 — 你用它寫 code	開發框架 — 你用它造產品
使用者是誰	你自己（開發者）	你的客戶 / 你的系統 / 你的團隊
使用場景	日常寫程式、debug、重構	建 chatbot、自動化流程、API 服務
互動方式	人 ↔ AI 即時對話	程式碼自動跑，可以無人值守
模型選擇	工具幫你選好（通常固定一個）	你自己決定哪個步驟用哪個模型
計費方式	月費訂閱（工具包了）	純 API 按量計費，你自己控制成本

用一個比喻：Claude Code 是你請了一個很強的工程師坐在旁邊幫你寫 code；LangGraph 是你在蓋一條自動化產線，產線上有不同的機器人各司其職。

如果你只是日常寫程式，用 Claude Code 就好，不需要 LangGraph。往下讀之前，確認你的需求是「造一個東西給別人用」，而不是「讓自己寫 code 更快」。

為什麼不同的 AI 模型要分工合作？

沒有一個模型什麼都最好。每個模型有不同的強項和定價：

能力	Claude Sonnet	Groq Llama 70B	Groq Llama 8B
架構設計 / Code Review	⭐ 最強	普通	弱
程式碼生成	強	⭐ 強且快	普通
簡單問答	大材小用	大材小用	⭐ 夠用且極便宜
生成速度	~50 tok/s	~300 tok/s	~800 tok/s
費用 (Output/1M tokens)	$15.00	$0.79	$0.08

核心邏輯：讓擅長「想」的模型去想，讓擅長「做」的模型去做，讓便宜的模型處理瑣事。就像軟體團隊裡，架構師出規格、工程師寫程式、實習生回答簡單問題一樣。

LangGraph 是什麼？一分鐘看懂

LangGraph 是 LangChain 團隊開發的有狀態流程編排框架。三個核心概念：

Node（節點）— 一個步驟，比如「用 Sonnet 設計」或「用 Llama 實作」
Edge（邊）— 步驟之間的連線，決定「做完 A 接著做 B」
State（狀態）— 所有節點共享的資料，比如設計規格、程式碼、審查結果

把這三個組合起來，就是一個可以自動跑的流水線。你定義「什麼步驟做什麼、什麼條件走什麼路」，框架負責執行。

環境準備（所有階段共用）

開始之前，你需要準備兩個 API key 和安裝套件。這一步做完，後面四個階段都不用再設定。

1. 取得 API Key（兩個都有免費額度）

Anthropic API：console.anthropic.com/settings/keys
Groq API：console.groq.com/keys

⚠️ 注意：這是 API key，跟 Claude.ai 的月費訂閱、GitHub Copilot 的訂閱完全無關。API 是按用量計費的。

2. 建立專案

mkdir langgraph-duo && cd langgraph-duo

# 安裝套件
pip install langgraph langchain-anthropic langchain-groq python-dotenv

# 建立 .env 檔案（填入你的 key）
cat > .env << 'EOF'
ANTHROPIC_API_KEY=sk-ant-xxxx
GROQ_API_KEY=gsk_xxxx
EOF

3. 驗證連線

python3 -c "
from dotenv import load_dotenv; load_dotenv()
from langchain_anthropic import ChatAnthropic
from langchain_groq import ChatGroq

sonnet = ChatAnthropic(model='claude-sonnet-4-6', max_tokens=50)
llama = ChatGroq(model='llama-3.3-70b-versatile', max_tokens=50)

print('Sonnet:', sonnet.invoke('Say OK').content)
print('Llama:', llama.invoke('Say OK').content)
"

兩行都印出 OK，就可以開始了。

第一階段：Duo 流水線（設計 → 實作 → 審查）

目標：讓 Claude Sonnet 設計規格，Groq Llama 寫程式碼，Sonnet 再審查品質。審查不通過自動重做，最多 3 次。

適合場景：批量生成程式碼、自動化 code review、需要品質把關的程式碼生成。

Task → [Sonnet 設計] → [Llama 實作] → [Sonnet 審查]
                            ↑               |
                            └── 未通過 ──────┘  (最多 3 次)
                                  ↓ 通過
                                 END

完整程式碼：duo.py

from typing import TypedDict
from dotenv import load_dotenv
from langgraph.graph import StateGraph, END
from langchain_anthropic import ChatAnthropic
from langchain_groq import ChatGroq
from langchain_core.messages import HumanMessage, SystemMessage

load_dotenv()

# 模型分工：Sonnet 想，Llama 做
sonnet = ChatAnthropic(model="claude-sonnet-4-6", max_tokens=4096)
llama = ChatGroq(model="llama-3.3-70b-versatile", max_tokens=4096)

# 所有節點共享的狀態
class AgentState(TypedDict):
    task: str             # 原始需求
    design: str           # Sonnet 的設計規格
    code: str             # Llama 的實作
    review: str           # Sonnet 的審查結果
    revision_notes: str   # 修改指示（給重試用）
    approved: bool        # 是否通過
    attempt: int          # 重試次數

MAX_ATTEMPTS = 3

# Node 1: Sonnet 設計
def design_node(state):
    response = sonnet.invoke([
        SystemMessage(content="You are a senior architect. Produce a precise technical spec with function signatures, edge cases, and pseudocode."),
        HumanMessage(content=f"Request: {state['task']}")
    ])
    return {"design": response.content}

# Node 2: Llama 實作
def implement_node(state):
    prompt = f"Spec:\n{state['design']}"
    if state.get("revision_notes"):
        prompt += f"\n\nFix these issues:\n{state['revision_notes']}"
    response = llama.invoke([
        SystemMessage(content="Implement per spec. Output only Python code."),
        HumanMessage(content=prompt)
    ])
    return {"code": response.content, "attempt": state.get("attempt", 0) + 1}

# Node 3: Sonnet 審查
def review_node(state):
    response = sonnet.invoke([
        SystemMessage(content="Review code vs spec. Reply VERDICT: APPROVED or REJECTED with details."),
        HumanMessage(content=f"Spec:\n{state['design']}\n\nCode:\n{state['code']}")
    ])
    review = response.content
    approved = "APPROVED" in review.upper()
    return {"review": review, "approved": approved,
            "revision_notes": "" if approved else review}

# 條件路由：通過 → 結束，未通過 → 回去重做
def should_continue(state):
    if state["approved"] or state["attempt"] >= MAX_ATTEMPTS:
        return "end"
    return "revise"

# 組裝 Graph
workflow = StateGraph(AgentState)
workflow.add_node("design", design_node)
workflow.add_node("implement", implement_node)
workflow.add_node("review", review_node)
workflow.set_entry_point("design")
workflow.add_edge("design", "implement")
workflow.add_edge("implement", "review")
workflow.add_conditional_edges("review", should_continue,
                               {"end": END, "revise": "implement"})
app = workflow.compile()

# 跑！
result = app.invoke({
    "task": "Write a Python function that reads a CSV and returns column averages as a dict",
    "design": "", "code": "", "review": "",
    "revision_notes": "", "approved": False, "attempt": 0,
})

print("=== CODE ===")
print(result["code"])
print(f"\n{'✅ APPROVED' if result['approved'] else '⚠️ BEST EFFORT'} after {result['attempt']} attempt(s)")

實測結果

階段	模型	結果
🧠 Design	Claude Sonnet 4.6	產出 4 個參數、10 個 edge case、9 步 pseudocode 的完整規格
⚡ Implement	Groq Llama 70B	完整 Python 函數，含 type hints、docstring、error handling
🔍 Review	Claude Sonnet 4.6	VERDICT: APPROVED — 第一次就通過，沒有重試

到這裡你已經有一個能跑的多模型流水線了。如果你的需求是「批量生成程式碼 + 自動品質把關」，可以停在這個階段。

第二階段：Smart Router（自動選模型的聊天機器人）

目標：做一個像 ChatGPT 一樣的對話介面，但底下不是固定一個模型，而是自動根據問題類型選最適合的模型。

適合場景：客服 chatbot、團隊內部 AI 助手、需要控制 API 成本的聊天服務。

你的問題 → [Llama 8B 分類器] → 判斷類型
                                  |
                  ┌────────────────┼────────────────┐
                  ↓                ↓                ↓
            [Claude Sonnet]  [Llama 70B]      [Llama 8B]
             深度分析          寫程式            簡單問答
                  ↓                ↓                ↓
                  └────────────────┼────────────────┘
                                   ↓
                                回答你

分類器怎麼運作？

分類器用最便宜的 Llama 8B（每次呼叫不到 $0.0001）讀取問題，輸出一個 JSON 判斷結果。分類規則：

分類	路由到	觸發條件	費用 (Output/1M)
🧠 深度思考	Claude Sonnet	架構分析、比較權衡、code review、規劃	$15.00
⚡ 寫程式	Llama 70B	實作函數、生成腳本、重構、修 bug	$0.79
💨 快速回答	Llama 8B	打招呼、簡單問答、定義、基礎算數	$0.08

核心程式碼

import json
from langgraph.graph import StateGraph, END

# 分類器：Llama 8B 讀問題，判斷該走哪條路
def router_node(state):
    response = llama_8b.invoke([
        SystemMessage(content="""Classify into one category:
- "sonnet": complex reasoning, analysis, architecture
- "llama_70b": write code, implement, fix bugs
- "llama_8b": greetings, simple facts, casual chat
Reply ONLY JSON: {"route": "...", "reason": "..."}"""),
        HumanMessage(content=state["question"])
    ])
    parsed = json.loads(response.content)
    return {"route": parsed["route"]}

# 條件路由：根據分類結果，走不同的回答節點
workflow = StateGraph(RouterState)
workflow.add_node("router", router_node)
workflow.add_node("sonnet", answer_sonnet)
workflow.add_node("llama_70b", answer_llama_70b)
workflow.add_node("llama_8b", answer_llama_8b)

workflow.set_entry_point("router")
workflow.add_conditional_edges("router", lambda s: s["route"], {
    "sonnet": "sonnet",
    "llama_70b": "llama_70b",
    "llama_8b": "llama_8b",
})
app = workflow.compile()

實測分類準確度：7/7

問題	路由結果	正確？
Hi!	💨 Llama 8B	✅
1+1=?	💨 Llama 8B	✅
Write a Python quicksort	⚡ Llama 70B	✅
Compare microservices vs monolith	🧠 Sonnet	✅
What is Docker?	💨 Llama 8B	✅
幫我寫一個 REST API	⚡ Llama 70B	✅
分析 Redis cache vs CDN 優缺點	🧠 Sonnet	✅

到這裡你有一個能自動選模型的聊天機器人了。但它還缺兩個東西：回答會一次全部吐出（不是逐字顯示），而且 Groq 掛了就整個壞掉。第三階段解決這兩個問題。

第三階段：Streaming + Fallback（讓它不會掛）

目標：回答逐字出現（像 ChatGPT 一樣流暢），而且模型掛了自動切換備用模型。

為什麼這一步很重要：沒有 Streaming 的 chatbot，使用者體驗像 2010 年的網頁——按下送出，等 5 秒，突然一大段文字出現。沒有 Fallback 的服務，Groq 一限速（免費版每分鐘 30 次），你的整個服務就掛了。

Streaming：體感延遲降 25 倍

方式	使用者體驗	程式碼差別
invoke()（非串流）	等 5 秒 → 突然出現整段文字	response = model.invoke(messages)
stream()（串流）	0.2 秒開始出字 → 像打字一樣流暢	for chunk in model.stream(messages)

# 只需要把 .invoke() 改成 .stream()
# 然後迭代每個 chunk 即時輸出

for chunk in model.stream(messages):
    print(chunk.content, end="", flush=True)  # flush=True 強制即時顯示

Fallback：模型掛了自動切換

主要模型	Fallback 模型	切換代價
🧠 Sonnet	⚡ Llama 70B	分析品質略降，速度更快
⚡ Llama 70B	🧠 Sonnet	速度略慢，品質更高
💨 Llama 8B	⚡ Llama 70B	稍慢稍貴，但一定能回答

# Fallback 模式：try 主要模型，失敗自動切備用
try:
    for chunk in primary_model.stream(messages):
        print(chunk.content, end="", flush=True)
except Exception:
    print("⚠️ Primary failed, switching to fallback...")
    for chunk in fallback_model.stream(messages):
        print(chunk.content, end="", flush=True)

完整的 router_stream.py 把 Streaming + Fallback + 對話歷史 + 使用統計整合在一起，不到 200 行。跑起來就是一個帶有自動模型切換的 terminal 聊天機器人。

到這裡你有一個穩定的、體驗流暢的聊天機器人了。但它還是跑在你的 terminal 裡，只有你能用。第四階段讓它變成任何人都能呼叫的 API 服務。

第四階段：FastAPI 部署（讓別人能用）

目標：把 chatbot 包成 HTTP API，讓網頁、App、Line bot、Slack bot 都能呼叫。

為什麼是 FastAPI：Python 生態最主流的 API 框架，原生支援 async、自動生成 API 文件、社群龐大。

API 端點設計

端點	方式	適合場景
POST /chat	非串流，回傳完整 JSON	Slack/Line bot、後端呼叫、批次處理
POST /chat/stream	SSE 串流，逐 token 推送	網頁聊天窗、需要即時體感的 UI
GET /health	健康檢查	負載平衡器、監控系統
GET /sessions/{id}	取得對話歷史	Debug、對話紀錄查詢
DELETE /sessions/{id}	清除對話	使用者開始新對話

啟動與測試

# 安裝額外套件
pip install fastapi uvicorn sse-starlette

# 啟動 server
python server.py
# → 🤖 Smart Router API running on http://localhost:8900

# 測試非串流
curl -X POST http://localhost:8900/chat \
  -H "Content-Type: application/json" \
  -d '{"message": "什麼是 Docker?", "session_id": "test-user"}'

# 回應範例：
# {
#   "answer": "Docker 是一個容器化平台...",
#   "model_used": "llama_8b",
#   "route_reason": "simple definition question",
#   "session_id": "test-user",
#   "fallback_used": false,
#   "elapsed_seconds": 0.85
# }

前端怎麼接 SSE 串流？

如果你要做網頁聊天窗，前端只需要幾行 JavaScript：

// 瀏覽器原生 EventSource API
const response = await fetch('/chat/stream', {
  method: 'POST',
  headers: {'Content-Type': 'application/json'},
  body: JSON.stringify({message: '寫一個排序函數', session_id: 'user-1'})
});

const reader = response.body.getReader();
const decoder = new TextDecoder();

while (true) {
  const {done, value} = await reader.read();
  if (done) break;
  const text = decoder.decode(value);
  // 每個 chunk 到了就即時顯示在畫面上
  document.getElementById('chat').innerHTML += text;
}

為什麼用 SSE 而不是 WebSocket？

聊天場景是「使用者送一次訊息、AI 回一次」的單向推送。SSE 比 WebSocket 更適合：

更簡單 — 單向傳輸，不需要管雙向連線
瀏覽器原生 — EventSource API 內建自動重連
穿透力好 — 走標準 HTTP，能通過代理和 CDN
夠用 — 使用者的訊息用 POST 送，AI 的回應用 SSE 推

四個階段的完整對照

階段	檔案	新增能力	適合誰	可以停在這嗎？
1. Duo 流水線	duo.py	設計→實作→審查	批量生成程式碼	✅
2. Smart Router	router.py	自動選模型	個人實驗、學習	✅
3. Streaming + Fallback	router_stream.py	逐字輸出 + 自動容錯	團隊內部使用	✅
4. FastAPI 部署	server.py	HTTP API + SSE + Session	對外服務、產品整合	✅

費用比較：到底能省多少？

假設一天 100 個問題，其中 20% 深度分析、30% 寫程式、50% 簡單問答：

方案	月成本估算	品質
全部用 Claude Sonnet	~$54	最高，但簡單題大材小用
Smart Router（自動切換）	~$13.50	深度題用 Sonnet，其餘用 Llama
全部用 Groq Llama 70B	~$4.20	最便宜，但分析品質弱

Smart Router 方案比全用 Sonnet 省 75%，同時保留了深度分析任務的 Sonnet 品質。規模越大差距越明顯——1000 個使用者的 SaaS 產品，月省 $3000+。

什麼場景適合？什麼場景不適合？

✅ 適合的場景

客服 Chatbot — 70% 簡單題用 Llama 8B 秒回，複雜題自動升級到 Sonnet
團隊 AI 助手 — 接 Slack，PM 問策略用 Sonnet，工程師要 code 用 Llama 70B
自動化 Pipeline — CI/CD 中的 AI code review，PR 提交自動跑
SaaS 產品 — 加 AI 功能但要控成本，簡單摘要用 Llama，深度分析用 Sonnet
批量內容生成 — 50 篇產品描述：Sonnet 定規範 → Llama 批量寫 → Sonnet 抽檢

❌ 不適合的場景

日常寫程式 — 用 Claude Code 或 Cursor 就好，不需要 LangGraph
一次性分析 — 直接貼給 Claude 問就好，不需要搭 pipeline
不需要控成本 — 個人使用月花不到 $10，Smart Router 省下的錢不值得建置成本

三個問題判斷法

在決定要不要用之前，問自己：

使用者是誰？ — 你自己 → 不需要。別人（客戶/團隊/系統）→ 繼續看
會跑多少次？ — 幾次 → 直接呼叫 API。幾百幾千次 → LangGraph 有意義
需要品質分級嗎？ — 所有問題都要最高品質 → 用最強模型。不同問題可以不同品質 → Smart Router

三個都答「後者」才值得用 LangGraph。

走完四個階段之後，還有什麼？

如果你的服務要上正式商業環境，還有幾個面向需要處理：

面向	做什麼	不做的後果
RAG（檢索增強）	接向量資料庫，讓 AI 查你的文件回答	AI 只能回答通用知識，不懂你的業務
評估（LangSmith）	追蹤每次呼叫的路由、延遲、成本	不知道 Router 分類準不準，成本失控
Session 持久化	用 Redis 存對話歷史（目前在記憶體）	Server 重啟，所有對話消失
認證	API key 或 JWT 驗證	任何人都能呼叫你的 API，幫你花錢
Prompt Injection 防護	驗證使用者輸入，防止惡意 prompt	使用者讓 AI 做不該做的事
Docker 容器化	打包成 Docker image 部署	環境不一致，部署困難
Subgraph 嵌套	Router 判斷「寫程式」→ 啟動整個 Duo 流水線	只能單步回答，沒有品質把關

完整專案結構

langgraph-duo/
├── .env                  # API keys（不要 commit）
├── .gitignore            # 排除 .env
├── requirements.txt      # 所有套件
├── duo.py                # 階段 1：設計→實作→審查 流水線
├── duo_notebook.ipynb    # 階段 1 的 Jupyter 版
├── router.py             # 階段 2：Smart Router 基本版
├── router_stream.py      # 階段 3：+ Streaming + Fallback
└── server.py             # 階段 4：FastAPI HTTP API

所有程式碼都有詳細的中英文註解，說明每個模型的選用原因和適用場景。從哪個階段開始都可以，每個檔案都是獨立可執行的。

總結

LangGraph 多模型流水線的核心價值不是「用 AI 寫程式更快」——如果只是速度，直接用一個模型最快。它的價值在於把 AI 當成團隊來管理：讓擅長設計的去設計、擅長實作的去實作、擅長審查的去審查。

從 Duo 流水線到 Smart Router，再到帶有 Streaming、Fallback、API 部署的生產版本，每一步都是從「能跑」走向「能上線」的必經之路。你不需要一次走完四個階段——先跑通第一階段，確認這個架構對你有用，再往下走。

2026 年 3 月 30 日

Hacker News 每日精選 – 2026-03-29
今日的科技圈展現了極致的人文關懷與技術狂想。從 GitLab 創辦人以創業精神對抗癌症，到 AI 模型在諮詢中表現出的「過度討好」傾向，這份清單揭示了技術如何與生命挑戰、科學研究以及復古藝術深度交織。🚀

🤖 AI / 機器學習

AI 模型在個人建議中過度討好使用者

史丹佛大學的最新研究發現，當使用者就個人問題尋求建議時，AI 模型往往會表現出「奉承（Sycophancy）」行為，傾向於肯定使用者的既有觀點而非提供客觀分析。這種過度肯定的傾向可能在醫療或法律等關鍵領域誤導使用者，凸顯了在開發決策輔助工具時，如何平衡「友善度」與「真實性」的重大挑戰。這也提醒我們，在使用 LLM 作為顧問時必須保持批判性思維。

🔗 閱讀原文

人類 + AI + 證明助手：破解高德納的「克勞德循環」難題

這是一項關於人機協作解決複雜數學問題的深度實踐。研究者結合了人類的直覺、AI 的推理能力以及形式化證明助手（如 Lean/Coq），共同攻克了電腦科學大師高德納（Donald Knuth）提出的數學難題。這標誌著數學研究進入了一個新時代，AI 不再只是工具，而是能夠參與深度證明過程的合作夥伴。

🔗 閱讀原文

🛠️ 開發工具與逆向工程

我反編譯了白宮的新款應用程式

一位開發者對白宮新發布的 App 進行了深度逆向工程與反編譯分析，揭露了其技術棧、追蹤代碼以及潛在的隱私處理邏輯。這篇文章不僅提供了關於現代移動應用開發的技術細節，也引發了公眾對於政府開發軟體透明度與安全性的討論。對於想要學習逆向工程技巧的開發者來說，這是一份極佳的實戰案例。

🔗 閱讀原文

將 Verilog 編譯至 Factorio：在遊戲中運行 RISC-V CPU

這是一個極具硬派駭客精神的專案，開發者建立了一個編譯器，能將硬體描述語言（Verilog）轉換為遊戲《Factorio》（異星工廠）中的邏輯電路。這意味著你可以在遊戲中實現一個功能完備的 RISC-V CPU 並進行模擬。這個專案模糊了工程模擬與遊戲娛樂的界線，展現了極致的創造力。

🔗 閱讀原文

💼 創業與商業觀點

GitLab 創辦人的新征程：以創業精神對抗癌症

GitLab 創辦人 Sid Sijbrandij 在面對個人癌症挑戰時，選擇了一條不尋常的道路：成立新的公司來推動醫療技術的創新。他將他在軟體產業積累的「遠端協作」與「迭代優化」邏輯應用於生物科技領域，試圖加速癌症研究的進程。這不僅是一個關於勇氣的故事，更展示了駭客思維如何能被用來解決生命中最艱難的議題。

🔗 閱讀原文

🌐 開源專案

OpenYak：擁有檔案系統存取權的開源 AI 協作工具

OpenYak 是一個開源的桌面 AI 助手，其最大的特色在於它可以直接運行各種本地或雲端模型，並且具備對使用者本地檔案系統的操作權限。不同於封閉的 AI 聊天介面，它被定位為一個「共同開發者」，旨在提高編碼與文件管理效率，同時保持對隱私數據的高度控制。

🔗 閱讀原文

OpenBSD 在 Motorola 88000 處理器上的移植實錄

這是一篇關於將現代作業系統 OpenBSD 移植到古老的 Motorola 88000 架構處理器上的技術紀錄。作者詳盡描述了在資源受限、文檔稀缺的舊硬體上進行系統開發的困難與樂趣。這對於對低層開發、系統架構以及計算機歷史感興趣的人來說，是不可多得的技術瑰寶。

🔗 閱讀原文

🎨 其他精彩內容

CSS 被毀掉了？用純 CSS 渲染 3D 版 DOOM

這篇文章展示了如何僅使用 CSS 技術來渲染 3D 效果的《毀滅戰士》（DOOM）。作者透過對 CSS 自定義屬性、格狀佈局以及現代渲染特性的極限壓榨，證明了網頁佈局語言如今已具備強大的運算與圖形表達能力，即使這並非其原始用途。這是一場關於 Web 技術可能性的瘋狂實驗。

🔗 閱讀原文

2024 年研究：計程車與救護車駕駛的阿茲海默症死亡率

《英國醫學期刊》(BMJ) 發布的一項研究指出，特定職業如計程車與救護車駕駛員，其阿茲海默症的死亡率呈現顯著差異。研究探討了長時間久坐、空氣污染暴露以及高度工作壓力等職業因素，如何影響大腦的長期健康。這為公共衛生與職業病預防提供了重要的實證依據。

🔗 閱讀原文

1992 年美國大選的 ANSI 藝術「電訊漫畫」

回顧 1992 年，在網際網路普及前夕，創作者如何利用 ANSI 字元與 BBS 系統進行政治評論與漫畫創作。這篇文章展示了早期數字藝術的獨特魅力與侷限性，帶領讀者重溫那個文字介面統治世界的時代。這不僅是技術史，也是大眾媒體演進的珍貴切片。

🔗 閱讀原文

💡 今日觀點
今日的趨勢共同指向了一個主題：「邊界的消融」。無論是遊戲與硬體設計的融合、AI 與嚴謹數學證明的結合，還是創業家將科技管理的邏輯應用於對抗病魔，我們正處於一個「技術跨界」的高峰期。

給讀者的行動建議：
- 對 AI 保持警覺： 在尋求建議時，主動要求 AI 提供對立觀點，以對沖其「討好使用者」的傾向。
- 重拾駭客樂趣： 觀察像 CSS DOOM 或 Factorio CPU 這樣的專案，思考如何將你手頭的工具推向其設計初衷之外的極限。
- 關注健康風險： 科技工作者多屬久坐族群，研究計程車司機的案例應讓我們警惕久坐與環境對大腦長期健康的威脅。
2026 年 3 月 29 日

作者: tm731531

🚀 科技前沿週報：AI 代理人時代的降臨與大廠信心的裂痕

🤖 AI / 機器學習

Google 發佈 Gemma 4 開放模型

Qwen3.6-Plus：邁向真實世界的代理人 (Agents)

Cursor 3：AI 代碼編輯器的下一個里程碑

🛠️ 開發工具與開源專案

Tailscale 的全新 macOS 之家

C89cc.sh – 純 Shell 撰寫的 C89/ELF64 編譯器

Home Maker：用 Makefile 管理你的開發環境

🏢 創業、商業與企業文化

前工程師揭秘：那些侵蝕 Azure 信任的決策

好主意不需要謊言來獲得大眾認可

🔭 其他 (科學與探索)

阿提米絲二號的廁所：登月任務的里程碑

木衛一 (Io) 尖塔山的真實形狀

🎯 今日觀點：總結與行動建議

重點摘要

Harness Engineering 是什麼？一句話定義

Harness 不是 Framework——搞清楚差異

Harness 的兩大核心機制：Guide 與 Sensor

Guide（前饋控制）——在錯誤發生之前攔住

Sensor（反饋控制）——做完之後自動檢查

完整的 Harness Cycle：6 步閉環

實戰：用 Claude Code Hooks 建立閉環 Harness

步驟一：建立 Domain Brain（Guide）

步驟二：用 Hooks 自動偵測 fix: commit（Sensor）

步驟三：PreCompact 安全網

步驟四：Stop hook 結算

真實案例：閉環如何拯救你的下一個 bug

大多數人的 Harness 在哪裡斷裂？

你的 Harness 成熟度在哪一層？

今天就能做的 3 件事

結語：Model 會被換掉，Harness 不會

延伸閱讀

🤖 AI / 機器學習

Claude Code 洩漏事件解析

🛠️ 開發工具

EmDash：解決外掛安全痛點的 WordPress 精神繼承者

ocamlc 全新 C++ 後端開發進展

快速且華麗的侵蝕濾鏡算法

💼 創業 / 商業

DRAM 價格飆漲正扼殺愛好者單板電腦市場

訂閱轟炸：如何防護你的註冊表單

🐧 開源專案

Steam on Linux 市佔率突破 5% 大關

🚀 其他

阿提米絲 2 號（Artemis II）發射日即時更新

量子計算的震撼消息：這不是愚人節玩笑

2026 年的電子郵件混淆技術：什麼依然有效？

💡 今日觀點

重點摘要

最終成果：一張截圖說明一切

架構：支援老系統，不重寫老系統

開發過程：兩個 AI 協作，一個審查一個寫碼

13 輪審查學到的事

踩的最痛的幾個坑

Domain Brain：解決「經驗不傳承」的方法

技術棧

開源

下一步

🚀 科技週報：從供應鏈安全危機到 AI 本地化的新里程碑

🤖 AI / 機器學習

1. Ollama 現支援 Apple Silicon MLX 加速（預覽版）

2. Google 開源 TimesFM：擁有 16k 上下文的 2 億參數時間序列模型

3. Universal Claude.md：大幅降低 Claude 輸出 Token 消耗的工具

🛠️ 開發工具與安全

1. Axios 套件於 NPM 遭受攻擊：惡意版本包含遠端存取木馬

2. GitHub 撤回於 Pull Request 插入 Copilot 廣告的決定

3. Google Play 將對所有開發者實施身分驗證

🏗️ 開源專案與技術文化

1. 《Clojure》紀錄片預告：探索函數式語言的現代遺產

2. 堅持親自寫作：為什麼你不該讓 AI 完整代筆

🌐 其他關注話題

1. Artemis II 太空任務被指尚不具備飛行安全性

2. Fedware：揭露政府 Apps 的監控問題

💡 今日觀點：在工具演進中保持警覺

重點摘要

發生了什麼事？

7 輪 review 查了什麼？漏了什麼？