C# 的 SemaphoreSlim 和 lock 有什麼差別？

lock 不支援 async/await，在非同步場景中使用會導致編譯錯誤或 deadlock。SemaphoreSlim 提供 WaitAsync() 方法，原生支援非同步等待，且可以設定同時允許的並發數量（permit），適合用於控制 HTTP 請求等非同步操作的並發數。

逆向工程 Google Maps 搜尋來取得座標合法嗎？

這取決於 Google 的服務條款和你所在地區的法律。從技術面來說，這種做法僅適合一次性、低頻率的個人用途。大量、持續性的爬取可能違反服務條款並導致 IP 被封鎖。商業用途建議使用官方 API 並付費。

如何選擇適合的資料庫類型？

三個關鍵問題：(1) 讀寫比例是什麼？讀多寫少考慮加 cache，寫多讀少考慮列式儲存。(2) 一致性需求多高？金融交易需要強一致性用 RDBMS，社群互動可接受最終一致性。(3) 查詢模式是什麼？需要 JOIN 用 RDBMS，全文搜尋用倒排索引，時序聚合用時序資料庫。

JMeter 壓力測試最常犯的錯誤是什麼？

最常見的錯誤是在同一台機器上同時運行 JMeter 和被測試的服務，這會導致資源互相爭搶，測試結果不準確。其次是只看平均回應時間而忽略 P99 百分位數，以及沒有進行暖機就開始計入測試結果。

從 DBA 轉型為後端架構師需要學什麼？

DBA 已經具備資料庫內部原理的深厚基礎，需要補足的是：(1) 程式語言的非同步與並發模型、(2) 分散式系統的基本概念（CAP 定理、一致性協議）、(3) 不同類型資料庫的適用場景、(4) 壓力測試與效能調校。重點是動手實驗而非只讀文章。

Claude Code 的 Domain Brain 是什麼？

Domain Brain 是按技術領域分類的 markdown 知識庫，記錄使用 AI coding agent 過程中踩過的坑。每個 brain file 用 [source: 專案名] 格式標記教訓來源，放在 ~/.claude/projects/{project}/memory/brain/ 目錄下。Agent 在開工前強制讀取，避免重複犯同樣的錯誤。

如何防止 Claude Code Agent Team 導致 OOM 當機？

三層防護：第一層在 CLAUDE.md 設定軟限制（最多 3 個 agent 同時跑）；第二層用 systemd cgroup 硬限制記憶體上限（claude-limited 指令限制 10GB）；第三層調整核心參數（vm.swappiness 降到 10，swap 擴到 8GB）。啟動前必須跑 pre-flight checklist 確認資源。

為什麼 AI Agent 的知識會跨 session 遺失？

每個 Claude Code session 啟動時只讀取 CLAUDE.md 和 MEMORY.md。如果教訓只記在對話中，session 結束就消失了。解決方法是建立 Domain Brain 知識庫，把教訓寫入持久化的 markdown 文件，並用 Hooks 自動偵測 fix: commit 強制更新 brain。

Claude Code Hooks 如何實現閉環學習？

在 settings.json 設定 PostToolUse hook，偵測 git commit 的 message 是否以 fix: 開頭。如果是，hook 會注入 additionalContext 到 agent 的 context window，強制它更新對應的 brain file。搭配 PreCompact hook（壓縮前提醒）和 Stop hook（session 結束檢查），形成三層安全網確保教訓不會遺失。

Agent Team 啟動時最常被忽略的文件是什麼？

AGENTS.md。這份文件定義了 team 的組織結構：每個 agent 的角色、使用的模型、任務邊界、和協作方式。沒有它，agent 啟動時不知道自己是誰，容易重複工作或做超出範圍的事。現在的做法是把 AGENTS.md 列為新專案的第一步強制動作。

使用 AI coding agent 最重要的經驗是什麼？

最重要的經驗是：AI 不是買回來就能用的工具，而是需要調教的。每條規則背後都應該有一個具體的災難故事；知識必須跨 session 存活（Domain Brain）；靠文字規則不夠，要靠系統強制（Hooks）；閉環比開環重要——Sensor 把教訓自動回寫到 Guide，harness 才會進化。

Harness 和 Framework 有什麼不同？

Framework（如 LangChain、CrewAI）提供零件讓你自己組裝 agent。Harness（如 Claude Code、Codex CLI）提供完整的運行環境，包含 context 管理、工具呼叫處理、權限控制和失敗處理。Framework 是建築材料，Harness 是建好的房子。

什麼是 Domain Brain？如何建立？

Domain Brain 是按技術領域分類的 markdown 知識庫，記錄過去踩過的坑。建立方法：在 ~/.claude/projects/{project}/memory/brain/ 目錄下，按領域建立 md 文件（如 python-crawler-data.md），格式為「[source: 專案名] 教訓描述」。然後在 CLAUDE.md 強制 agent 開工前讀取。

Claude Code 的 Hooks 可以用來做什麼？

Claude Code Hooks 是在特定事件發生時自動執行的命令。常用的 hook 事件包括：PostToolUse（工具使用後自動跑 linter 或偵測 fix: commit）、PreCompact（context 壓縮前保存重要提醒）、Stop（session 結束時檢查未完成的工作）。Hook 可以返回 JSON 注入 additionalContext，強制 agent 執行特定動作。

如何讓 AI Agent 的知識不會隨 session 消失？

建立閉環 Harness：每次 fix: commit 後用 PostToolUse hook 自動偵測，強制 agent 將教訓寫入 Domain Brain 文件。下次新 session 啟動時，agent 讀取 Brain 就能帶著所有過去的經驗開始工作。這樣知識就從「存在某個 commit 裡」變成「活在每次 session 的 context 裡」。

iDempiere 可以接 AI 嗎？

可以。用 OSGi plugin 作為 UI 入口，HTTP 呼叫獨立的 Python FastAPI 服務，由 LangGraph 路由到 Claude Sonnet 或 Groq Llama。不需要修改 iDempiere 任何既有程式碼。

ERP 接 AI 怎麼保護客戶個資？

使用可逆 PII 脫敏：DB 查詢結果中的姓名、身分證、統編等欄位，在送往外部 LLM 之前替換為 [PII_C_001] 格式的 token。LLM 回答後再還原。LLM 從頭到尾看不到真實個資。

Domain Brain 是什麼？

一種按技術領域（而非按專案）組織開發經驗的知識管理方法。把所有專案踩過的坑濃萃成領域檔案（如 OSGi、2Pack、PO Model），新專案開工前自動載入對應的領域腦。防止跨專案重複踩坑。

為什麼 AI Code Review 會漏掉已知的 bug？

AI 專家 review 只驗證當前文件的邏輯一致性，不會自動跨專案比對歷史踩坑紀錄。除非明確要求 AI 先讀取舊專案的經驗文件，否則同樣的 bug 會重複出現。

怎麼讓 Claude Code 記住上次踩過的坑？

建立跨專案的 pitfalls 記憶檔案（存在 ~/.claude/projects/memory/），在 MEMORY.md 索引中標記為 MANDATORY，這樣每次新對話都會自動載入索引。然後在開始寫計畫之前，明確要求 AI 先讀取相關的 pitfalls 檔案。

AI 專家 review 和經驗傳承有什麼差別？

專家 review 是「這份計畫有沒有邏輯錯誤」，經驗傳承是「上次做類似的事踩了什麼坑」。前者驗證當前文件的正確性，後者需要跨專案歷史比對。兩者都需要，但經驗傳承必須在 review 之前做。

專案太多，AI 怎麼知道要參考哪個舊專案？

目前沒有自動化解法。Claude Code 的記憶系統是平的，沒有語意觸發機制。你需要手動建立跨專案的 pitfalls 記憶檔案，並在 MEMORY.md 標記為 MANDATORY。但如果你自己都忘了有哪些專案，這條防線就會失守。真正需要的是 Git hooks 級別的自動觸發：偵測到同類型工作時，自動列出相關專案的歷史紀錄。

什麼是領域腦（Domain Brain）？怎麼建立？

領域腦是把散落在多個專案 CLAUDE.md 裡的經驗，按技術領域（而非按專案）濃萃成的知識文件。例如所有 OSGi 的坑整理成一份 idempiere-osgi-bundle.md，不管經驗來自哪個專案。建立方法：派 AI agent 讀完所有專案文件，按領域分類萃取，存在記憶系統的 brain/ 目錄下。新經驗直接更新對應領域腦，不用記得來自哪個專案。

跟 AI 合作，資深工程師為什麼反而更容易踩坑？

因為雙方都太有信心。資深工程師一聽就懂，AI 就跳過確認步驟快速產出。結果跳過的步驟裡藏著盲區。如果用戶是新手，AI 反而會更謹慎地每步確認。資深用戶需要主動踩煞車，要求 AI 先讀歷史文件再動手。

為什麼叫 20 個 AI 專家 review 還是會漏 bug？

因為這 20 個專家只看當前文件，不會自動去讀其他專案的歷史紀錄。就像請 20 個新員工審查，但不給他們看前任的交接文件。他們能找到邏輯錯誤，但找不到經驗性的坑。

小丁的家

作者: tm731531

失智症照護行動指南：媽媽的每日工作站

對象：65歲，阿茲海默中期

經歷：醫院護工10年、廚房助工20年、會計7年

核心原則：她不是病人，是來上班的人

一、採買清單

傳統市場（每週一次）

買什麼	跟攤販怎麼說	預算	用途
整球蒜頭 2-3斤	「要整球的，不要剝好的」	80-180元	每天剝一斤
帶殼毛豆一大袋	直接買就是帶殼的	50-70元	剝殼
帶葉玉米 3-5支	「整支帶葉子的」	50-100元	剝外葉去鬚
整把帶根蔥	市場本來就是整把的	20-30元	剝外層去根鬚
帶蒂辣椒	直接買	20-30元	去蒂去籽
整顆高麗菜	不要切半的	30-50元	手撕成小片
杏鮑菇/金針菇	直接買	30-50元	手撕成條

南北貨行 / 雜糧行（每月一次）

買什麼	預算	說明
帶殼花生 3-5斤	90-250元	最耗時，CP值之王
帶殼蓮子 1-2斤	80-160元	去皮去芯極度費工
散裝紅豆、綠豆、花豆各1斤	100-150元	混在一起讓她分類
帶殼瓜子 1-2斤	60-120元	剝殼取仁

全聯 / 大賣場

買什麼	預算	說明
餃子皮（冷藏）	30-50元	搭配備好的餡，她在客廳包
糯米粉	30元	加水揉好端出去讓她搓湯圓
餛飩皮	30-40元	比餃子小顆，數量多更耗時

一次性購入

買什麼	預算	用途
塑膠桌墊	50-100元	鋪客廳桌當工作檯
小盆子/碗 4-5個	家裡有就好	分裝成品，剝好的跟沒剝的分開
電子血壓計	500-800元	讓她自己量，啟動護工記憶
印章＋印泥	50-100元	會計蓋章用
釘書機（小型）	50元	裝訂紙張
計算機	100元	按數字、加總

每月預算

項目	月花費
市場食材	300-500元
餃子皮/糯米粉等	100-200元
雜糧豆類	100-150元
合計	約 500-850元/月

二、每日排班表

地點：客廳大桌（鋪塑膠墊）

早上（主要工作時段）

時間	活動	身分	你要準備什麼
8:00	給她抹布，擦桌子、擦扶手	護工	一條乾淨抹布
8:20	撕高麗菜＋撕菇類	廚房	整顆菜＋盆子放桌上
8:50	剝蒜頭	廚房	整球蒜頭＋兩個碗
9:30	撥豆芽	廚房	自家種的豆芽
9:45	分類零錢或整理發票	會計	零錢罐＋分類碗 / 一疊發票
10:15	剝花生或包餃子	廚房	帶殼花生 / 餃子皮＋餡料
11:00	摺毛巾、配對襪子	護工	一籃洗好的衣物毛巾
11:30	擦餐具排碗筷	廚房	洗好的碗筷＋擦布

下午（輕量活動，看狀態調整）

活動	身分	說明
量血壓、記錄	護工	讓她自己操作
澆花、擦葉子	護工	如果家裡有盆栽
抄寫數字 / 按計算機	會計	給她紙筆或一張「帳單」
蓋章 / 釘書機裝訂	會計	紙張＋印章
剝花生 / 剝瓜子	廚房	可以邊看電視邊做

每週大工程輪替（避免做膩）

週一	週二	週三	週四	週五
包餃子	搓湯圓	剝蓮子	包餛飩	揉麵團

三、話術指南

核心原則：她是來上班的，不是被安排活動

情境	不要說	要說
給她工作	「來，做這個打發時間」	「這個麻煩妳處理一下」
她做完了	「好棒喔」	「手腳很快耶」
換下一個任務	「接下來玩這個」	「這個好了，接下來這邊幫我弄一下」
擦桌子	「你擦一擦好不好？」	「這邊你順便整理一下」
分零錢	「來數數看」	「這些幫我對一下」
她說要回家	~~「這裡就是家啊」~~	「忙完這些就休息」
居服員來	~~「阿姨來照顧你了」~~	「來幫忙的來了」

依身分切換語氣

廚房的事 → 像主廚交代備料的語氣
護工的事 → 像護理長分配工作的語氣
會計的事 → 像主管交辦的語氣

「要回家」的應對

不糾正、不否定、不講道理。

她：「我要回家」

你：「妳想家了齁。」（先接住）

她：「對啊我要回去」

你：「妳家是什麼樣子？」（讓她說，回憶本身就是回家）

或：「好，忙完這些就休息。」（用工作自然轉移）

或：「妳在家的時候都做什麼？」（引導進入回憶）

四、注意事項

安全

項目	做法
刀具	所有需要切的你在廚房先處理好，她只做手撕手剝的
火源	廚房維持鎖住
硬幣	分零錢時在旁邊，確認不會放嘴巴。有疑慮改用發票分類
花生	剝殼工作，不是吃。成品收走，不要邊剝邊吃避免噎到
釘書機	觀察使用狀況，亂釘就收起來

廁所

項目	做法
廁所辨識	廁所門貼大張馬桶圖片，門保持開著、燈保持亮
定時提醒	每 1.5-2 小時說「休息一下，去上個廁所再繼續做」
動線	確保她坐的位置看得到廁所方向

窗戶

項目	做法
維持鎖死	換隱藏式鎖具（內六角螺絲型），看不出來也拆不了
補償光照	窗簾白天全開，讓自然光進來
補償換氣	其他房間開窗或開空氣清淨機
減少暗示	用窗簾遮住鎖具

成果處理

原則	說明
成品要真的被使用	她剝的蒜真的拿去炒菜，包的餃子真的煮來吃
不要當面重做	即使做得不完美也直接收起來
可以重複利用	零錢分完收起來隔天再拿出來，她不會記得做過
讓她看到結果	「妳剝的蒜頭，剛炒了一盤菜，很香」

居服員溝通重點

不要用「帶你去」→ 改用「陪你」或「你帶我去」
讓她走在前面、她決定方向
居服員的角色從「帶領者」變成「跟隨者」
進來時先跟她一起做事，像同事，不是來服務她
如果可以，讓她指揮居服員做事（她當師傅，居服員當學徒）

五、行為解讀速查

她的行為	可能的意思	建議回應
撞窗戶要出去	「我該去上班了」/ 想奪回控制感	帶她到工作桌「上工」
說要回家	想回到熟悉安全的時空	接住情緒，不糾正事實
抗拒居服員	覺得所有人都在控制她	讓居服員用同事模式
拒絕被帶出門	不是不想出門，是不想被決定	給她假選擇權：「想去公園還是巷口？」
藏東西	在奪回控制權	檢查固定藏東西的位置
在廚房大便	廚房是她認定的「自己地盤」/找不到廁所	廁所標示+定時帶去
安靜不動	可能是平靜，也可能是退縮	觀察表情：有回應=好，空洞=注意

六、觀察記錄（每天花2分鐘記）

留意以下項目，找出規律：

今天情緒好的時段？當時在做什麼？
今天情緒差的時段？之前發生了什麼？
有沒有說要回家？幾點說的？
有沒有想開窗？幾點？
進食狀況？
睡眠狀況？
如廁狀況？

最重要的一句話：

她一輩子都在服務別人——護工照顧病人、廚房餵飽客人、會計管好帳。

她的價值感來自「被需要」。所有活動的核心話術只有一個：

「這個要麻煩妳了。」

2026 年 4 月 4 日

後端老兵的工具箱：C# 非同步、Python 逆向工程、架構選型實戰

寫了十幾年後端，從 SQL Server DBA 一路走到架構師，我發現後端開發實戰能力的核心從來不只是會寫 SQL。真正拉開差距的，是你工具箱裡有多少把不同的扳手。這篇文章整理了我在 dotblogs 上累積的幾個關鍵主題：C# 非同步模式、Python 逆向工程實戰、資料庫架構選型、壓力測試，以及從 DBA 到架構師的技術演進。每一個主題都不是教科書式的介紹，而是實際踩過坑之後的心得。後端開發實戰最重要的一課：不要只讀，要動手測。

TL;DR 重點摘要

C# 非同步控制：SemaphoreSlim 比 lock 更適合 async 場景，BlockingCollection 是 producer-consumer 的標準解法，別再自己造輪子。
Python 逆向工程：當 API 太貴，直接逆向 Web 介面的 JSON 回應是可行路線，但要做好延遲控制與路徑文件化。
架構選型：資料庫不是選最潮的，而是看存取模式決定 — 高頻讀用 cache、搜尋用倒排索引、日誌用列式儲存。
壓測不是選配：沒壓測過的系統就是紙老虎，JMeter 的 Thread Group + Listener 是最基本的品質門檻。

1. C# 非同步模式 — Semaphore 與 BlockingCollection

在 .NET 後端開發中，非同步處理是繞不開的主題。當你有 100 個 HTTP 請求要同時發出去，但目標伺服器只能承受 10 個並發時，你需要的不是 lock，而是 SemaphoreSlim。

為什麼 Semaphore 比 lock 更適合 async？

很多人習慣用 lock 來控制並發，但 lock 有一個致命問題：它不支援 async/await。你不能在 lock 區塊裡面 await，否則會收到編譯錯誤。即使你繞過去了（用 Monitor），async 的 continuation 可能在不同執行緒上執行，導致 unlock 失敗。

SemaphoreSlim 則原生支援 WaitAsync()，專為 async 場景設計。它的心智模型是「停車場」：車位（permit）有限，滿了就在外面等，有車出來才放行。

// SemaphoreSlim throttling concurrent HTTP requests
public async Task<List<string>> FetchAllAsync(List<string> urls)
{
    // Only allow 10 concurrent requests
    var semaphore = new SemaphoreSlim(10);
    var httpClient = new HttpClient();
    var tasks = urls.Select(async url =>
    {
        await semaphore.WaitAsync();
        try
        {
            var response = await httpClient.GetStringAsync(url);
            return response;
        }
        finally
        {
            semaphore.Release();
        }
    });

    var results = await Task.WhenAll(tasks);
    return results.ToList();
}

注意 finally 裡的 Release() — 不管成功或失敗都要釋放，否則 permit 會洩漏，最終所有請求都會卡住。

BlockingCollection：Producer-Consumer 的標準解法

BlockingCollection<T> 是 .NET 內建的執行緒安全佇列，底層預設使用 ConcurrentQueue。它最強大的特性是 GetConsumingEnumerable() — consumer 端可以用 foreach 持續等待新資料，直到 producer 呼叫 CompleteAdding()。

// Producer-Consumer pattern with BlockingCollection
var queue = new BlockingCollection<WorkItem>(boundedCapacity: 100);

// Producer thread
Task.Run(() =>
{
    foreach (var item in GetWorkItems())
    {
        // Blocks if queue is full (back-pressure!)
        queue.Add(item);
        Console.WriteLine($"Produced: {item.Id}");
    }
    queue.CompleteAdding(); // Signal no more items
});

// Consumer thread
Task.Run(() =>
{
    // Blocks automatically when queue is empty
    // Exits when CompleteAdding() is called and queue is drained
    foreach (var item in queue.GetConsumingEnumerable())
    {
        ProcessItem(item);
        Console.WriteLine($"Consumed: {item.Id}");
    }
});

這裡的 boundedCapacity: 100 是關鍵 — 它提供了背壓（back-pressure）機制。當 consumer 處理速度跟不上 producer 時，佇列滿了 producer 就會被阻塞，而不是無限制地吃記憶體。這跟傳統 ThreadPool 的固定 worker 模型不同：ThreadPool 維護一組固定的執行緒，而 Semaphore + BlockingCollection 用的是「等待」機制，更彈性也更省資源。

2. Python 逆向工程 — 當 API 太貴，我就自己拆

2021 年我碰到一個需求：要把 2600 多筆地址轉成經緯度座標。Google Maps Geocoding API 當時每 1000 次要收 5 美元，算一算要十幾美元。對一個一次性的專案來說，這太不划算了。

於是我打開 Chrome DevTools，觀察 Google Maps 搜尋框的網路請求。發現它回傳的不是標準 JSON API，而是一個巢狀極深的陣列結構。座標藏在類似 d[16][0][0][7][1][3] 這種路徑裡。

import requests
import json
import time
import random

def geocode_address(address):
    """Reverse-engineered Google Maps search to extract coordinates."""
    url = "https://www.google.com/maps/search/"
    params = {"q": address}
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
                       "AppleWebKit/537.36 Chrome/91.0"
    }

    resp = requests.get(url, params=params, headers=headers)
    text = resp.text

    # The response contains a deeply nested JSON-like structure
    # Find the coordinate data block
    try:
        # Extract the nested array from response
        start = text.find("window.APP_INITIALIZATION_STATE")
        if start == -1:
            return None

        # Parse the nested structure
        data_start = text.find("[", start)
        data_end = text.find("];", data_start) + 1
        raw = text[data_start:data_end]

        # Navigate the deeply nested path for coordinates
        parsed = json.loads(raw)
        # Path varies by response type, document it!
        lat = parsed[16][0][0][7][1][3][0]
        lng = parsed[16][0][0][7][1][3][1]
        return (lat, lng)
    except (IndexError, KeyError, json.JSONDecodeError):
        return None


def batch_geocode(addresses):
    """Process addresses with random delays to avoid detection."""
    results = {}
    for i, addr in enumerate(addresses):
        coords = geocode_address(addr)
        results[addr] = coords
        print(f"[{i+1}/{len(addresses)}] {addr} -> {coords}")

        # Random delay: 3~15 seconds to mimic human behavior
        delay = random.uniform(3, 15)
        time.sleep(delay)

    return results

幾個實戰經驗：

隨機延遲是必須的：固定間隔很容易被偵測，3 到 15 秒的隨機延遲更像人類行為。
文件化提取路徑：d[16][0][0][7][1][3] 這種路徑完全沒有語意，Google 隨時可能改結構。你必須在程式碼旁邊寫清楚這條路徑代表什麼，否則三個月後你自己也看不懂。
錯誤處理要寬容：有些地址搜不到、有些回傳結構不同，用 try/except 包住並記錄失敗的地址，事後手動補。
這不是長期方案：逆向工程的結果隨時會因為前端改版而失效，只適合一次性或低頻的資料收集。

最終我用這個方法在一個週末處理完 2600 多筆地址，成本是零。但我也很清楚：如果這是一個需要長期維護的服務，老老實實付 API 費用才是正道。

3. 架構選型 — 不同系統該用什麼資料庫？

2021 年我在部落格上寫了一系列「架構師慢慢學」的文章，其中最受歡迎的是資料庫選型。核心觀點只有一句話：資料庫的選擇應該由存取模式驅動，而不是技術潮流。

太多團隊因為「大家都在用 MongoDB」就把所有東西塞進去，結果需要 JOIN 時痛不欲生。也有人因為「Redis 很快」就把所有資料都放 cache，然後面對一致性問題束手無策。

系統類型 vs 資料庫選型對照表

系統類型	建議資料庫	原因
後台管理系統（Admin）	RDBMS（PostgreSQL / SQL Server）	低併發、需要複雜查詢和 JOIN、資料完整性優先
高流量前台系統	RDBMS 後端 + Redis 前端	RDBMS 保證資料正確，Redis 用 Key/Value 加速讀取
日誌 / Log 系統	列式儲存（ClickHouse）+ 倒排索引（Elasticsearch）	寫入量大、需要聚合分析和全文搜尋
交易系統	RDBMS + Cache + 一致性協議	ACID 不可妥協，cache 用於讀加速但需要失效策略
即時監控系統	時序資料庫（InfluxDB / TimescaleDB）	時間序列寫入優化、自動聚合降精度
搜尋系統	RDBMS 後端 + Elasticsearch 前端	RDBMS 為資料源，ES 提供倒排索引加速模糊搜尋

幾個決策原則：

先問讀寫比例：讀多寫少 → 考慮加 cache；寫多讀少 → 考慮列式儲存或訊息佇列緩衝。
再問一致性需求：金融交易不能最終一致，社群按讚可以。
最後問查詢模式：需要 JOIN → RDBMS；需要全文搜尋 → 倒排索引；需要時間範圍聚合 → 時序 DB。

這不是什麼高深的理論，但我看過太多團隊在第一步就跳過去，直接被「這個技術很紅」帶著走。

4. JMeter 壓測 — 不壓測的系統都是紙老虎

你寫的 API 在開發機上跑得飛快，但上線後 100 人同時用就當機了。這種事我見過不止一次。壓力測試不是「有空再做」的事情，它是品質門檻。

JMeter 基本設定

Apache JMeter 是免費的壓測工具，核心概念只有三個：

Thread Group（執行緒群組）：模擬多少使用者同時操作。設定 Number of Threads = 100 就是 100 個並發使用者。
Sampler（取樣器）：每個使用者要做什麼動作。最常用的是 HTTP Request Sampler，填入 URL、Method、Body 就行。
Listener（監聽器）：收集結果的報表。Summary Report 給你吞吐量和錯誤率，Aggregate Report 給你百分位數響應時間。

關鍵指標怎麼看

指標	意義	健康標準（參考）
Throughput	每秒處理的請求數	依業務而定，但應隨並發數線性增長直到瓶頸
P90 Response Time	90% 的請求在此時間內完成	一般 API < 500ms
P99 Response Time	99% 的請求在此時間內完成	應 < P90 的 3 倍，否則有長尾問題
Error Rate	失敗請求的百分比	< 0.1% 為優秀，> 1% 要警覺

常見錯誤

在同一台機器上跑 JMeter 和被測服務：JMeter 本身也吃 CPU 和記憶體，會互相干擾。壓測機和被測機必須分開。
沒有暖機（Warm-up）：JVM 或 .NET 的 JIT 編譯在前幾次請求時會比較慢，應該先跑一輪不計入結果的請求。
只看平均值：平均響應時間 200ms 看起來很好，但如果 P99 是 5 秒，代表每 100 個使用者就有 1 個等 5 秒。看百分位數才有意義。
不模擬真實場景：所有人都打同一個 API endpoint 不代表真實負載。應該混合不同操作的比例。

我的習慣是：在專案中期就開始跑基準壓測，而不是上線前才慌張地補。早發現瓶頸，修復成本低十倍。

5. 從 DBA 到架構師 — 我的技術演進路線

我的技術路線不是一開始就規劃好的，而是一步步堆疊出來的：

2020：SQL Server DBA — 每天看執行計劃、調索引、處理 deadlock。這個階段讓我理解了資料庫內部的儲存引擎、鎖機制、B-Tree 索引結構。
2021：.NET 後端開發 — 開始寫 C# Web API，發現 DBA 背景讓我寫出的 SQL 比大多數工程師都好。但也發現自己在非同步、設計模式上的不足。
2022-2023：全端開發 — 接觸前端、Python、爬蟲、自動化。工具箱從一把螺絲起子變成一整個工具箱。
2024-2026：架構設計 — 開始做系統設計、技術選型、效能規劃。發現以前每個階段的經驗都在這裡匯聚。

DBA 背景帶給我的不公平優勢

理解資料庫內部運作，會從根本上改變你寫應用程式的方式：

你知道 SELECT * 在有 covering index 時多浪費多少 I/O，所以你會主動只選需要的欄位。
你知道 NVARCHAR 和 VARCHAR 在 DATALENGTH() 下的差異，所以你會根據實際資料選擇正確的型別。
你看過太多 table scan 的慘案，所以你設計 API 時會強制分頁，而不是讓使用者一次撈全部。
你理解 transaction isolation level 的差異，所以你知道什麼時候用 READ COMMITTED SNAPSHOT 可以大幅降低鎖爭用。

給後端工程師的建議

如果你想往架構方向發展，我的建議是：學任何東西都要動手測試。

想搞懂索引？建一個百萬筆的測試表，比較有索引和沒索引的執行計劃。
想搞懂 SemaphoreSlim？寫一個 console app，開 1000 個 task，觀察不同 permit 數量的效果。
想搞懂資料庫選型？不要只讀比較文章，自己用 Docker 裝一個 ClickHouse、一個 PostgreSQL，塞相同的資料，跑相同的查詢，比較速度。

2021 年我在部落格上寫「架構師慢慢學」系列時，最大的收穫不是寫出來的文章，而是為了寫文章去做的那些實驗。讀十篇文章不如自己跑一次 DATALENGTH() 比較 CHAR 和 VARCHAR 的儲存差異。那個數字會刻在你腦子裡，比任何文章都深。

結語

後端工程師的價值不在於精通某一個框架或語言，而在於工具箱的廣度和深度。C# 的非同步模式讓你處理高並發，Python 的靈活性讓你快速解決一次性問題，架構選型的思維讓你做出正確的技術決策，壓力測試讓你對系統有信心。

這些東西沒辦法在一天內學會，但每一個都值得你花時間去實驗。畢竟，不壓測的系統是紙老虎，不動手的學習是紙上談兵。

如果你也是從 DBA 或其他專精領域起步的工程師，不要覺得自己起步晚。每一個階段的深度經驗，都會在你走向架構師的路上成為別人沒有的武器。

2026 年 4 月 4 日

SQL Server 踩坑實錄：從 DELETE 不釋放空間到 NOT IN 效能炸彈

這篇文章是我從 DBA 到全端架構師這幾年，在 SQL Server 效能優化上踩過的坑的總整理。不是教科書式的理論，而是每一條都是我實際測試、實際踩雷後的血淚經驗。如果你正在處理 SQL Server 效能優化的問題——DELETE 後空間沒釋放、查詢莫名其妙變慢、鎖定機制搞不清楚——這篇應該能幫你少走不少冤枉路。

TL;DR 重點摘要

DELETE 不會釋放磁碟空間，只是標記刪除。要真正回收空間，必須用 TRUNCATE 或 ALTER INDEX REBUILD。
NOT IN 是效能炸彈，改用 NOT EXISTS 可以讓查詢快數十倍，尤其在子查詢結果集大的時候。
沒有 TABLOCKX 的交易不安全，並行交易會讀到未提交的資料（Dirty Read），高併發場景務必設定正確的隔離層級。
暫存表不是都一樣，@ 表變數、# 本地暫存表、## 全域暫存表各有適用場景，選錯會嚴重影響效能。

1. 儲存空間的真相 — DELETE 真的刪除了嗎？

這大概是我當 DBA 第一年最震驚的發現：DELETE 不會釋放磁碟空間。它只是把資料列標記為「ghost record」，等待背景的 Ghost Cleanup 程序來處理。但即使 Ghost Cleanup 跑完了，那些頁面（Page）還是屬於該表的配置空間，不會歸還給作業系統。

如果你想真正回收空間，只有兩條路：

TRUNCATE TABLE：直接釋放所有資料頁面，包含 7-byte 的列標頭（row header），速度極快，但會清除所有資料。
ALTER INDEX … REBUILD：重建索引時重新組織頁面，回收碎片化的空間。

三種配置單元（Allocation Unit）

SQL Server 在底層把資料分成三種配置單元儲存：

配置單元	儲存內容	典型欄位類型
IN_ROW_DATA	固定長度 + 行內變動長度資料	char, int, datetime, nvarchar(100)
LOB_DATA	大型物件資料	nvarchar(max), text, image, xml
ROW_OVERFLOW_DATA	超過 8060 bytes 的變動長度資料	nvarchar 超過行內限制時溢出

CHAR vs VARCHAR 的儲存差異

很多人以為「反正都是存字串」，但底層差異巨大。CHAR(100) 不管你存 1 個字還是 100 個字，永遠佔用 100 bytes。VARCHAR(100) 則只儲存實際資料長度加上 2 bytes 的長度前綴。

-- Verify with DATALENGTH()
DECLARE @fixed CHAR(100) = 'Hello';
DECLARE @variable VARCHAR(100) = 'Hello';

SELECT DATALENGTH(@fixed) AS CharLength,      -- Result: 100
       DATALENGTH(@variable) AS VarcharLength; -- Result: 5

另外要注意：索引佔用的是真實空間（IN_ROW_DATA）。當你清空表後，索引也被清空。但只要 INSERT 新資料，索引會立即重新填充。而且 VARCHAR 欄位建索引時，仍然受到 900 bytes 索引鍵大小限制。

Azure SQL Database 的常見假警報

在 Azure SQL Database 上，大量 DELETE 後看到儲存空間快滿了——這是假警報。空間根本沒被釋放。DELETE ... WITH (TABLOCK) 效果有限，必須搭配 TRUNCATE 或 ALTER INDEX ALL ON [TableName] REBUILD 才能真正回收。

2. 鎖定機制 — 你的交易真的安全嗎？

我曾經在生產環境遇過一個離奇的 Bug：兩筆交易同時更新同一張表，結果一筆交易讀到了另一筆還沒 COMMIT 的資料。這就是經典的 Dirty Read（髒讀）。

不使用適當鎖定機制時，會碰到三種資料異常：

異常類型	說明	情境
Dirty Read（髒讀）	讀到其他交易未提交的資料	T1 UPDATE 未 COMMIT，T2 SELECT 讀到修改後的值
Non-repeatable Read（不可重複讀）	同一交易內兩次讀取結果不同	T1 SELECT → T2 UPDATE COMMIT → T1 再次 SELECT 結果變了
Phantom Row（幻影列）	同一交易內多出新的資料列	T1 SELECT → T2 INSERT COMMIT → T1 再次 SELECT 多了一列

正確的做法：TABLOCKX 排他鎖

-- Problem: Without TABLOCKX, T2 can read T1's uncommitted changes
-- Session 1
BEGIN TRAN T1;
UPDATE Orders SET Amount = 999 WHERE OrderID = 1;
-- (not committed yet)

-- Session 2 (runs concurrently, sees Amount = 999 → Dirty Read!)
SELECT Amount FROM Orders WHERE OrderID = 1;

-- Solution: Use TABLOCKX for exclusive access
BEGIN TRAN T1;
SELECT * FROM Orders WITH (TABLOCKX) WHERE OrderID = 1;
-- Now T2 is BLOCKED until T1 commits or rolls back
UPDATE Orders SET Amount = 999 WHERE OrderID = 1;
COMMIT TRAN T1;

在高併發場景中，如果不想鎖整張表，也可以考慮設定交易隔離層級為 SERIALIZABLE 或使用 ROWLOCK, UPDLOCK 組合，但 TABLOCKX 是最簡單粗暴且確定有效的方式。

3. 查詢優化 — EXISTS vs IN 的效能陷阱

這個坑我踩了不止一次。先講結論：

正向查詢（EXISTS vs IN）：執行計畫幾乎相同，效能差異不大。
否定查詢（NOT EXISTS vs NOT IN）：NOT EXISTS 遠遠快於 NOT IN，差距可達數十倍。

-- NOT IN: Slow — performs O(n*m) comparison, NULL handling issues
SELECT * FROM Products
WHERE ProductID NOT IN (
    SELECT ProductID FROM OrderDetails
);

-- NOT EXISTS: Fast — uses semi-join, stops at first match
SELECT * FROM Products p
WHERE NOT EXISTS (
    SELECT 1 FROM OrderDetails od
    WHERE od.ProductID = p.ProductID
);

-- Additional trap: if OrderDetails.ProductID contains ANY NULL value,
-- NOT IN returns ZERO rows! NOT EXISTS handles NULL correctly.

NOT IN 之所以慢，是因為它必須對子查詢的每一筆結果做比對，而且還要處理 NULL 的三值邏輯。NOT EXISTS 則是用半連接（Semi-Join）策略，找到第一筆匹配就停止。

排序與 TOP 的隱藏陷阱

加上 TOP 之後，SQL Server 的排序演算法會完全改變。沒有 TOP 時用完整排序（Full Sort），有 TOP 時用 Top-N Sort，記憶體需求和執行路徑完全不同。

SQL 執行順序（必背）

很多查詢優化的問題，根源是不理解 SQL 的實際執行順序：

FROM → JOIN → WHERE → GROUP BY → HAVING → SELECT → DISTINCT → ORDER BY → TOP/OFFSET

注意 SELECT 在 WHERE 之後，所以你不能在 WHERE 中使用 SELECT 裡定義的別名。而 ORDER BY 在 SELECT 之後，所以可以用別名排序。理解這個順序，很多「為什麼這樣寫不行」的問題都迎刃而解。

另外，索引不只消除全表掃描，還能跳過排序階段。如果 ORDER BY 的欄位剛好有索引，SQL Server 可以直接按索引順序讀取，省掉排序的 CPU 和記憶體開銷。

4. 全文檢索 — 比 LIKE ‘%keyword%’ 快一百倍

如果你的應用有「搜尋文章內容」的需求，還在用 LIKE '%keyword%'，那你的查詢基本上每次都是全表掃描。全文檢索（Full-Text Search）透過反向索引（Inverted Index）來加速文字搜尋，效能差距是數量級的。

建立全文檢索的前提與步驟

前提：目標表必須有主鍵（Primary Key）。因為反向索引需要唯一識別碼來對應每筆資料。

-- Step 1: Enable full-text search on the database (if not already)
-- (SQL Server installs Full-Text Search as a feature)

-- Step 2: Create a full-text catalog
CREATE FULLTEXT CATALOG ftCatalog AS DEFAULT;

-- Step 3: Create a full-text index on the table
-- The table MUST have a primary key
CREATE FULLTEXT INDEX ON Articles (
    Title LANGUAGE 1028,      -- 1028 = Traditional Chinese
    Content LANGUAGE 1028
)
KEY INDEX PK_Articles          -- Must reference the PK
ON ftCatalog
WITH CHANGE_TRACKING AUTO;     -- Auto-update when data changes

-- Step 4: Query using CONTAINS or FREETEXT
SELECT * FROM Articles
WHERE CONTAINS(Content, N'效能優化');

-- Compare with LIKE (full table scan every time)
SELECT * FROM Articles
WHERE Content LIKE N'%效能優化%';

語言設定很重要：LANGUAGE 1028（繁體中文）會使用對應的斷詞器（Word Breaker），直接影響搜尋品質。英文斷詞用空格就行，但中文斷詞需要語意分析，設錯語言會導致搜不到結果。

5. 監控與追蹤 — 沒有 Profiler 怎麼辦？

SQL Server Profiler 在生產環境不一定能用（效能開銷太大，或者根本沒權限）。這時候 DMV（Dynamic Management Views）就是你的救星。

追蹤特定時間範圍的查詢

-- Find top queries by CPU time within a time range
SELECT TOP 20
    qs.last_execution_time,
    qs.execution_count,
    qs.total_worker_time / 1000 AS total_cpu_ms,
    qs.total_elapsed_time / 1000 AS total_elapsed_ms,
    qs.total_logical_reads,
    SUBSTRING(st.text,
        (qs.statement_start_offset / 2) + 1,
        ((CASE qs.statement_end_offset
            WHEN -1 THEN DATALENGTH(st.text)
            ELSE qs.statement_end_offset
          END - qs.statement_start_offset) / 2) + 1
    ) AS query_text
FROM sys.dm_exec_query_stats qs
CROSS APPLY sys.dm_exec_sql_text(qs.sql_handle) st
WHERE qs.last_execution_time >= '2026-04-04 09:00:00'
  AND qs.last_execution_time <= '2026-04-04 18:00:00'
ORDER BY qs.total_worker_time DESC;

查看當前執行中的程序

-- Quick check: who's running what right now?
EXEC sp_who2;

-- Or with more detail via DMV
SELECT
    r.session_id,
    r.status,
    r.command,
    r.wait_type,
    r.wait_time,
    t.text AS query_text,
    r.cpu_time,
    r.reads,
    r.writes
FROM sys.dm_exec_requests r
CROSS APPLY sys.dm_exec_sql_text(r.sql_handle) t
WHERE r.session_id > 50; -- Exclude system sessions

全庫儲存空間盤點

-- Iterate all user tables and check space usage
CREATE TABLE #SpaceUsed (
    TableName NVARCHAR(128),
    Rows NVARCHAR(20),
    Reserved NVARCHAR(20),
    Data NVARCHAR(20),
    IndexSize NVARCHAR(20),
    Unused NVARCHAR(20)
);

DECLARE @tbl NVARCHAR(128);
DECLARE tbl_cursor CURSOR FOR
    SELECT TABLE_SCHEMA + '.' + TABLE_NAME
    FROM INFORMATION_SCHEMA.TABLES
    WHERE TABLE_TYPE = 'BASE TABLE';

OPEN tbl_cursor;
FETCH NEXT FROM tbl_cursor INTO @tbl;

WHILE @@FETCH_STATUS = 0
BEGIN
    INSERT INTO #SpaceUsed
    EXEC sp_spaceused @tbl;
    FETCH NEXT FROM tbl_cursor INTO @tbl;
END

CLOSE tbl_cursor;
DEALLOCATE tbl_cursor;

SELECT * FROM #SpaceUsed ORDER BY CAST(REPLACE(Reserved, ' KB', '') AS BIGINT) DESC;
DROP TABLE #SpaceUsed;

6. 暫存表大全 — @、#、## 到底差在哪？

SQL Server 有三種暫存表，看起來差一個符號，但行為天差地別：

特性	@TableVar（表變數）	#TempTable（本地暫存表）	##GlobalTemp（全域暫存表）
儲存位置	記憶體（小量時）/ tempdb	tempdb	tempdb
統計資訊	無（優化器假設 1 列）	有	有
作用範圍	當前批次/程序	當前 Session	所有 Session
交易回滾	不受 ROLLBACK 影響	受 ROLLBACK 影響	受 ROLLBACK 影響
可建索引	僅限宣告時的約束	可隨時建立	可隨時建立
適用場景	少量資料（< 100 列）	大量資料、需要索引	跨 Session 共享資料

選擇指南

資料量 < 100 列，且不需要索引 → 用 @TableVar
資料量大，需要統計資訊讓優化器做正確決策 → 用 #TempTable
需要跨 Session 共享（例如 ETL 中間結果） → 用 ##GlobalTemp（但要小心生命週期管理）
在 ROLLBACK 時需要保留資料（例如錯誤日誌） → 用 @TableVar，因為它不受交易回滾影響

-- Table variable: optimizer always estimates 1 row
DECLARE @small TABLE (ID INT, Name NVARCHAR(50));
INSERT INTO @small SELECT TOP 10 ID, Name FROM Products;

-- Local temp table: has statistics, better for large datasets
CREATE TABLE #bigtemp (ID INT, Name NVARCHAR(50));
INSERT INTO #bigtemp SELECT ID, Name FROM Products;
CREATE INDEX IX_bigtemp_ID ON #bigtemp(ID); -- Can add indexes

-- Global temp table: visible to all sessions
CREATE TABLE ##shared (ID INT, Name NVARCHAR(50));
-- Other sessions can SELECT from ##shared

最常見的錯誤是：把幾萬筆資料塞進 @TableVar，然後納悶為什麼 JOIN 超慢。原因是優化器認為裡面只有 1 列，選了 Nested Loop 而不是 Hash Join。換成 #TempTable 就正常了。

結語

SQL Server 的這些坑，有的文件上有寫但沒人看，有的要自己測過才會懂。我把這幾年的經驗整理在這裡，希望能幫到正在跟 SQL Server 搏鬥的你。如果只能記住一件事，請記住：NOT IN 是效能炸彈，永遠用 NOT EXISTS 取代它。這一個改動可能就能讓你的查詢從分鐘級變成秒級。

常見問題 FAQ

Q: DELETE 後空間沒有減少，是 Bug 嗎？

不是 Bug，這是 SQL Server 的設計。DELETE 只標記刪除，頁面仍歸屬於表。使用 TRUNCATE TABLE 或 ALTER INDEX REBUILD 來真正回收空間。

Q: NOT IN 和 NOT EXISTS 結果一樣嗎？

不一定。如果子查詢包含 NULL 值，NOT IN 會返回空結果集（因為 NULL 的比較結果是 UNKNOWN）。NOT EXISTS 則能正確處理 NULL。除了效能差異，正確性也是選擇 NOT EXISTS 的原因。

Q: 什麼時候該用表變數 @，什麼時候用暫存表 #？

簡單判斷：資料量少於 100 列用 @，超過就用 #。關鍵差異在於統計資訊——表變數沒有統計資訊，優化器會做出錯誤的執行計畫。

Q: 全文檢索和 LIKE 差多少？

在百萬筆資料的文字欄位上，全文檢索可以比 LIKE '%keyword%' 快 100 倍以上。LIKE 前綴帶 % 時無法使用索引，只能全表掃描；全文檢索則使用反向索引，直接定位包含關鍵字的列。

Q: 生產環境不能用 SQL Profiler 該怎麼監控？

使用 DMV（動態管理檢視）：sys.dm_exec_query_stats 搭配 sys.dm_exec_sql_text 可以按時間範圍追蹤查詢，sys.dm_exec_requests 可以看當前正在執行的查詢，效能衝擊遠小於 Profiler。

2026 年 4 月 4 日

訓馬筆記：兩個月把 Claude Code 從脫韁野馬馴成工作夥伴的完整紀錄

重點摘要

這是一篇真實的「訓馬筆記」——記錄一個工程師花兩個月，把 Claude Code 從一匹脫韁野馬馴成穩定的工作夥伴
每一條規則背後都是一次災難。32 個具體的坑、7 條鐵律、9 個領域知識庫，全部是用血淚換來的
結論：AI 不是買回來就能用的工具，它是一匹需要調教的馬。你的 harness 決定它能跑多遠

2026 年 2 月，我開始全職跟 Claude Code 合作。寫 ERP 外掛、做電商 OMS、搞量化回測、建爬蟲系統——大概七八個專案同時推進。

兩個月後回頭看，我發現最有價值的不是寫了多少 code，而是我踩了多少坑、立了多少規矩。這篇文章是完整的訓馬筆記——每一個階段的災難、調適、和最後形成的紀律。

如果你也在用 AI coding agent，這些坑你可能正在踩，或者即將踩。

第一階段：裸奔期（2 月）——什麼規矩都沒有

剛開始合作的時候，我就像買了一匹賽馬，直接騎上去就跑。沒有韁繩、沒有馬鞍、沒有圍欄。

坑 1：回測引擎 37 筆交易全部假停損（2/27）

我讓 Claude 幫我寫量化回測引擎。跑出來 350 根 K 棒的上漲趨勢數據，結果 37 筆交易全部在第一天就觸發停損退場，勝率 0%。在一個明顯的上漲趨勢裡。

花了兩天才找到 root cause：引擎把「含滑價的進場價」和「原始市場價」搞混了。

具體來說：原始價格 $26.84，加上 $1.0 滑價後進場價 $27.84。停損線 = $27.84 × 0.97 = $27.01。隔天價格 $26.87，因為 $26.87 < $27.01 就觸發停損了。但如果用原始價格算：$26.84 × 0.97 = $26.03，$26.87 > $26.03，根本不該停損。

一個欄位的混用，讓整個系統的行為完全反轉。

教訓：技術指標和風險管理用原始市場價格，損益計算用含滑價的有效價格。兩個值必須分開追蹤，永遠不能混用。

坑 2：OMS 上線一天爆 5 個 bug（2/25）

電商 OMS 系統上線第一天，同時爆了 5 個 bug：

Health Check 用了獨立的 DTO，結果 channel job 不認這個格式，健康檢查直接壞掉
String → JsonNode 反序列化失敗，Kafka consumer 一直報錯
ChannelSyncLog 少了 syncType 欄位，資料寫不進去
Health check 的 log 缺必要欄位（merchantId、platformId、status、detail）
改完 code 沒重新編譯就部署，舊版本還在跑

每一個都不是什麼高深的 bug，但它們同時出現就是災難。問題出在哪？沒有人看全景。改了 producer 沒看 consumer，改了 DTO 沒看 caller，改了 code 沒重新 build。

這次事件催生了後來的「OMS 約法三章」：

基礎架構（Docker/PostgreSQL/Kafka/Nginx）不輕易變動
安全機制必須全系統同步
任何 Kafka producer/consumer 的改動，必須驗證完整的事件流

第二階段：立規矩期（3 月初）——從災難中學會設限

如果第一階段是「馬亂跑」，第二階段就是「開始圍柵欄」。每一條規矩都是某次災難的直接產物。

坑 3：9 個 Opus Agent 同時跑，系統直接當機（3/3）

這是整個兩個月最慘烈的事件。

我的機器是 16GB RAM 的 mini PC，上面常態跑著 26 個 Docker 容器。那天早上 8:36 我開始研究 Claude Code 的 Agent Team 功能，覺得很興奮——「可以同時派好多 agent 幫我做事！」

11:18，我啟動了一個叫 simpleec-review 的 team，裡面有 9 個 Opus agent。11:56，覺得不夠快，又啟動了 whale-51w，再加 2 個 agent。

12:00 左右，整台機器凍結。

每個 in-process Opus agent 大約佔 1GB RAM（Node.js runtime + API connection + streaming buffer + context window）。9 個就是 ~9GB。加上 Docker 的 3-5GB 和系統本身的 1-2GB，總共超過 16GB。OOM killer 開始殺進程，但殺完又重啟，無限循環。

事後盤點：18 個任務中 8 個卡在 in_progress 永遠不會完成，1 個 pending，0 個 completed。全軍覆沒。

調適：三層防護

第一層（軟限制）：CLAUDE.md 規定 Agent Team 最多 3 個同時跑
第二層（硬限制）：建了 claude-limited 指令，用 systemd cgroup 限制記憶體上限 10GB
第三層（核心參數）：vm.swappiness 從 60 降到 10，swap 從 512MB 擴到 8GB

從此以後再也沒有 OOM 過。代價是一個下午的工作歸零。

坑 4：爬蟲日期解析——西元 1150 年（3/10）

台灣用民國年曆。TWSE 的 API 回傳日期格式是 7 位數字，例如 "1150309" 代表民國 115 年 3 月 9 日（= 西元 2026 年）。

Claude 把它解析成西元 1150 年 3 月 9 日。

同一天還發現：TPEX 的 API 欄位名叫 TransactionAmount，但 code 裡寫的是 TradingMoney。一個是 API 的真實名稱，一個是文件上寫的名稱——它們不一樣。

調適：

7 位數字 = ROC 格式，前 3 碼是民國年
欄位名永遠用 API 實際回傳的，不用文件寫的
最重要的：不准重寫爬蟲。爬蟲系統已經穩定，只能用 CLI（analyst collect twse_price --date 2026-03-10）

為什麼「不准重寫」這麼重要？因為隔天，Claude 在另一個任務裡又建了一個 /tmp/backfill_twse.py，把爬蟲邏輯整個複製出來。同樣的錯，不到 24 小時就重演了。

這讓我意識到一件事：教訓會跨 session 遺失。我在 session A 教了「不要重寫爬蟲」，session B 完全不知道這件事。這催生了後來的 Domain Brain 系統。

坑 5：中文寫進 code 裡（3 月初）

Claude 很貼心，知道我是台灣人就開始在 code 裡寫中文 comment 和中文 variable name。

問題是：中文 comment 在很多終端機上會亂碼、在 grep 時很痛苦、在 code review 時外國同事看不懂。我直接跟它說：

「中文我看不懂」（在 code context 裡）

於是立了一條看似矛盾但完全合理的雙重規則：

對話用繁體中文——因為我是台灣人，中文溝通效率最高
Code 全部英文——comment、variable、output message、文件，一律英文

第三階段：建立知識系統（3 月中）——從「個別規則」到「領域知識庫」

到了 3 月中，我已經有十幾條規則了。但我發現一個根本問題：規則散落在各個專案的 CLAUDE.md 裡，跨專案不通。

在 analyst 專案學到的「ROC 日期要特別處理」，到了 stock-verify 專案就不知道了。在 OMS 專案學到的「Kafka 改動要看全景」，到了 AI Assistant 專案就忘了。

坑 6：Agent Team 卡死 80 分鐘，因為一個文件不存在（3/16）

我設計了一個 Agent Team 來做 code review，其中 Task 5 需要讀 docs/5-FRONTEND/ADMIN_APP_IMPLEMENTATION.md。

這個文件不存在。目錄是 5-KAFKA，不是 5-FRONTEND。

Task 5 啟動後在 1 分鐘內就卡住了，然後卡了 80 分鐘。因為 Task 7-9 都依賴 Task 5 的輸出，整個 team 全部癱瘓。9 個 agent 的鏈式架構，一個環節斷了全部死。

調適：

9-agent 鏈式架構改成 3-agent 星狀拓撲——降低相依性
建立 Agent Team Pre-Flight Checklist——每次啟動前必須：檢查記憶體、確認文件存在、設計拓撲、計算資源、取得用戶確認
寫下 root cause：Agent Team 卡住的根本原因是文件缺失，不是模型能力問題

Domain Brain 的誕生

3/16 事件之後，我決定建一個跨專案的知識系統。我叫它 Domain Brain——按技術領域分類的「踩坑筆記」。

~/.claude/projects/-home-tom/memory/brain/
├── python-crawler-data.md      # 爬蟲的坑
├── python-llm-integration.md   # LLM 整合的坑
├── idempiere-osgi-bundle.md    # OSGi 的坑
├── idempiere-2pack.md          # 2Pack 部署的坑
├── idempiere-po-model.md       # PO Model 的坑
├── idempiere-rest-api.md       # REST API 的坑
├── stock-backtesting.md        # 回測的坑
├── oms-event-driven.md         # OMS 事件驅動的坑
└── design-principles.md        # 設計原則的坑

每個 brain file 的格式：

## ROC Date Format
- [source: analyst] "1150309" 被解析成 AD 1150 年，要用 7 位 YYMMDD ROC 格式

## Holiday / Empty Response
- [source: analyst] TWSE API 假日返回空值，必須 guard if not data: return []

[source: analyst] 標記這個教訓來自哪個專案。這樣在其他專案讀到時，知道這不是泛泛之談，是某次真實事件的結論。

然後在全域 CLAUDE.md 裡加一條：

「開工前必須讀 Domain Brain。如果你跳過這步，bug 出在 brain 裡有記錄的東西，那是你的失敗。」

第四階段：行為紀律（3 月下旬）——從「知道」到「做到」

知識庫建好了，但新的問題出現：Claude 知道規則但不一定遵守。就像你告訴馬「不要踩田裡的菜」，牠聽懂了，但一興奮起來照踩不誤。

坑 7：直接推 code 到 main branch

有一天我發現 Claude 直接把 code 推到 main branch。main 是我的穩定版本，只有 dev 確認穩定後才 merge 回去。

這不是什麼複雜的規則，但 Claude 就是沒有這個概念。它看到 repo 就 commit、就 push，不管你在哪個 branch。

鐵律：

Session 開始第一件事：git branch 確認在 dev
永遠不准 git push origin main
如果不小心在 main 上 commit 了：cherry-pick 到 dev，push dev，main 不動

坑 8：過度設計——給低頻查詢加 Redis cache（3/26）

我讓 Claude 設計一個功能，它自動加了 Redis cache。問題是：這個功能一天被呼叫不到 10 次。

Claude 的邏輯是：「cache 可以提升效能」→「所以應該加 cache」。這在教科書上沒錯，但在現實中，一天 10 次的查詢加 cache 只是增加了一個可能壞掉的元件。

我因此制定了頻次驅動設計原則——所有功能設計前必須先問三個問題：

多常被觸發？→ 決定要不要 cache
計算有多貴？→ 決定要不要預計算
需要即時還是最終一致？→ 決定要不要 event-driven

禁止的 pattern：給低頻讀取加 Redis、給低頻單 consumer 寫入加 Kafka、沒有數據支撐就做「效能優化」。

坑 9：iDempiere 的 10 個坑（持續累積）

iDempiere 是一個 15 年歷史的 ERP 系統，Claude 的訓練資料裡幾乎沒有它。所以每一步都是坑：

坑	發生什麼	正確做法
@Model annotation 用錯 package	用了不存在的 `org.idempiere.base.annotation.Model`	`org.adempiere.base.Model`
initPO 用不存在的方法	`POInfo.getPOInfo(ctx, tableName)` 沒有 String 參數版本	先 `MTable.getTable_ID()` 拿 int，再傳入
List 欄位 type cast	`(Integer) get_Value()` 對 CHAR 欄位爆 ClassCastException	用 `instanceof` 判斷型別
2Pack UUID 永遠 NULL	`IsUpdateable=N` 導致 PO framework 寫不進去	`_UU` 欄位 `IsUpdateable` 必須 Y
Grid View 點新增就爆	`AD_Field` 缺 `SeqNoGrid` 和 `IsDisplayedGrid`	每個 field 兩個屬性都要有
Menu ID hardcode	寫死 `AD_Menu_ID = 146`，目標環境沒這個 ID	用 UUID reference：`reference="uuid"`
REST API token 沒換	POST 拿到 token 後沒做 PUT 換 session token	兩步驟：POST → PUT，舊 token 立即失效
OData 過濾用 ne	`$filter=... ne ...` 結果不對	要用 `neq`，不是 `ne`
OSGi 兩個 component 放一個 XML	只有第一個被 SCR 讀到	一個 XML 一個 component
Plugin class 找不到	`Class.forName()` 用 core classloader	實作 OSGi DS component，用 bundle 自己的 classloader

這 10 個坑全部記在 brain/idempiere-*.md 裡。現在每次開 iDempiere 相關的工作，Claude 會先讀這些 brain file。同一個坑，不會踩第二次。

坑 10：LLM 回傳的 JSON 炸掉整條 pipeline

做 AI Assistant 的時候，我讓 LLM 回傳 JSON 來做 routing。prompt 裡寫了「ONLY return valid JSON」。

現實是：LLM 就是會回傳無效的 JSON。有時候前面加一句「Sure! Here’s the JSON:」，有時候 response.content 直接是 None，呼叫 .strip() 就爆 AttributeError。

一個 router/classifier 的 crash 會癱瘓整條 pipeline。

調適：

永遠 catch (json.JSONDecodeError, AttributeError, TypeError)
永遠有 fallback 值（例如 "general_knowledge"）
Router/classifier 不可以 crash 整條 pipeline
LLM client 在 module level 初始化會阻擋 mock mode → 改成 lazy-init
沒設 timeout → 無限 hang → 所有 client 設 timeout=25.0
最重要：永遠不讓 LLM 生成 SQL。只用 pre-defined SQL，安全參數從 request 強制注入

第五階段：自動化閉環（4 月初）——從「靠記憶」到「系統強制」

到了 3 月底，我有了 7 條鐵律、9 個 brain file、32 個記錄的坑。但還是有一個根本問題：

Brain 的更新靠 Claude 記得做。它經常忘記。

CLAUDE.md 裡寫著「每次 fix: commit 後必須更新 brain」，但這只是文字。就像公司牆上貼的「安全第一」標語——大家都看到了，沒人真的做。

4 月 3 日，我決定把這個 cycle 自動化。用 Claude Code 的 Hooks 系統（Harness Engineering）建了 4 個自動化 sensor：

Hook	觸發時機	做什麼
PostToolUse	每次 `git commit`	偵測 `fix:` 開頭 → 注入「必須更新 brain」的指令到 context
PreCompact	context 壓縮前	掃描最近 5 個 commit，有 fix: 就提醒
Stop	session 結束	比對 fix: 數量 vs brain 更新數量
SessionStart	session 開始	標記開始時間（給 Stop hook 用）

效果：Claude commit 了 fix: handle empty API response → hook 自動偵測到 → Claude 的 context 被注入一段「你現在必須更新 brain file，不准做下一件事」的強制指令。

它不能「忘記」了，因為系統不讓它忘記。

第六階段：照鏡子——工作流程的精煉（4 月）

走到第五階段，系統穩了、規則立了、自動化跑了。

但有一天我問 Claude 一個問題：「我們現在跟最早的你，差距多遠？」

它的回答讓我意識到，我一直在修正一個更深層的問題——不只是 bug，而是合作模式本身。

坑 11：AGENTS.md 從來沒有被建立過

Agent Team 一再失敗，我長期把原因歸咎到記憶體不夠、文件缺失、拓撲設計問題。這些都是真的，但都是症狀。

真正的根本原因是：每個 agent 啟動時，不知道自己是誰。

AGENTS.md 是一份定義 Agent Team 組織結構的文件——誰負責什麼、用什麼模型、任務邊界在哪、跟其他 agent 怎麼協作。沒有這份文件，就像把九個新人同時丟進一個專案，沒有分工表、沒有組織圖，叫他們自己搞清楚。

我當時知道事情一直出問題，但沒找到根本原因。後來才發現，我養成了一個補償行為：每次要啟動 team 之前，我都會先問 Claude「你覺得還缺什麼文件？」

我以為這是謹慎的好習慣。仔細想，這是我在幫 Claude 做它本來就應該主動做的事。

現在 AGENTS.md 是所有新專案的第一步強制動作，和 Domain Brain 並列寫進 CLAUDE.md 的「New Project Setup」。

坑 12：「討論完就開始做」不等於有計畫

兩個月裡，每次開工前我們都會大量討論——分析需求、評估方案、確認方向。我一直以為那就是計畫。

但有一個關鍵差別沒意識到：

討論是活在對話裡的，session 結束就消失了。計畫是一份文件，它是執行的合約。

更重要的是：計畫的讀者不是我，是執行的 agent。那個 agent 沒有參與討論，沒有上下文，不知道我們為什麼這樣決定。

一個不夠詳細的 PLAN.md 會讓執行者只能猜意圖。猜錯就要回頭重做。

現在要求的標準是：每個執行步驟都必須回答四件事——做什麼（具體動作）、在哪裡（檔案路徑）、成功的樣子（怎麼知道這步完成了）、不要做（邊界，避免 agent 自作主張）。

「實作登入功能」是爛計畫。「呼叫 POST /api/auth/login，成功後把 token 存 localStorage(‘token’)、把 context 存 localStorage(‘context’)，失敗時顯示人話而非 HTTP status code」才是計畫。

寫計畫不是給聰明人看的。不是每個腦子都跟你一樣聰明。

驗收標準不該由我想

以前的工作流是：Claude 說完成 → 我去測 → 發現問題 → 回來修。

問題不是 Claude 能力不足，是從來沒有在開始前說清楚「完成長什麼樣」。

現在的做法：Plan 成形時，Claude 主動起草驗收清單給我確認。不是叫我從零想，是它根據我們的討論整理出草稿，我只需要回「對」或「改第二條」。這把「驗收責任」從我一個人扛，變成流程的一部分。

2 月的我 vs 4 月的 Claude

我問 Claude 這個問題，它說了一句話讓我覺得很誠實：

「最早的我是一個聰明但不可靠的執行者。現在應該是一個有記憶、有流程、會主動管理風險的協作者。但有一部分差距，是你花了大量時間糾正才填起來的——這些本來應該是我自己的責任。」

這句話是這兩個月最好的總結。

兩個月的數字

指標	2 月（裸奔期）	4 月（現在）
鐵律（Iron Rules）	0	7
Domain Brain files	0	9 個領域
記錄的具體 bug/pitfall	0	32+
自動化 Hooks	0	4
OOM 當機次數	—	1 次（再也沒發生）
同一個 bug 踩兩次的頻率	常態	有機制防止
強制工作流節點	0	3 個（AGENTS.md / PLAN.md / 驗收清單）

結語：AI 不是工具，是一匹馬

買一匹馬回來，你不會期望它第一天就知道路。你得教它不要踩田、不要亂跑、轉彎時要減速、聽到哨聲要停。

AI coding agent 也一樣。Claude 很聰明——它能寫任何 code、debug 任何問題、理解任何架構。但「聰明」不等於「可靠」。一匹沒訓過的馬也很有力量，但力量加上失控只會更慘。

這兩個月教我的事：

每條規則都要有故事——沒有災難背景的規則，AI 不會認真對待
知識必須跨 session 存活——Domain Brain 讓教訓不死在 commit 裡
靠文字規則不夠，要靠系統強制——Hook 比 CLAUDE.md 裡的「MUST」有效 100 倍
閉環比開環重要——Sensor 把教訓自動回寫到 Guide，harness 才會進化
協作模式也需要調教——規則、計畫、驗收標準，都要變成系統，不能靠臨時記憶

2 月的 Claude 是一匹脫韁野馬。4 月的 Claude 是同一匹馬，但有了韁繩、馬鞍、和一本厚厚的訓練日誌——還有一套讓牠不能假裝忘記的系統。

馬沒有變。變的是騎手。

2026 年 4 月 3 日

Hacker News 每日精選 – 2026-04-03

🚀 科技前沿週報：AI 代理人時代的降臨與大廠信心的裂痕

今天的科技圈焦點集中在 AI 模型能力的持續爆發，特別是從「對話」轉向「行動代辦」的重大進展。與此同時，一名前工程師對微軟 Azure 的內部爆料引發了業界對雲端基礎設施可靠性與企業價值的深度討論。身為開發者，了解這股從底層工具到頂層應用的技術變革，將是保持競爭力的關鍵。⚡

🤖 AI / 機器學習

Google 發佈 Gemma 4 開放模型

Google 隆重推出了最新一代的 Gemma 4 系列模型，這是一套基於與 Gemini 相同技術架構的開放權重模型。Gemma 4 在保持輕量化的同時，顯著提升了邏輯推理與多語言處理能力。對於希望在本地環境部署高效能 AI 的開發者來說，這無疑是一個極具吸引力的選擇，進一步縮小了開源與閉源模型之間的差距。✨

原文連結：Google Gemma 4 Official Announcement

Qwen3.6-Plus：邁向真實世界的代理人 (Agents)

阿里巴巴的 Qwen 團隊發表了 Qwen3.6-Plus，這款模型的核心目標是成為能處理複雜任務的「代理人」。它在調用外部工具、規劃長流程任務以及理解真實場景指令方面展現了卓越的實力。這標誌著 AI 發展的新階段：我們不再只是跟機器聊天，而是讓機器幫我們把事情辦成。🛠️

原文連結：Qwen3.6-Plus Blog Post

Cursor 3：AI 代碼編輯器的下一個里程碑

深受工程師喜愛的 AI 編輯器 Cursor 正式推出了第 3 版，進一步強化了其自動補全與上下文理解能力。新版本不僅優化了性能，還引入了更深度的代碼庫索引技術，讓 AI 能夠更精準地根據全專案邏輯進行重構。Cursor 的持續進化，正在重新定義開發者的編程體驗，將「結對編程」提升到新的高度。💻

原文連結：Cursor 3 Release Notes

🛠️ 開發工具與開源專案

Tailscale 的全新 macOS 之家

熱門虛擬網路工具 Tailscale 為其 macOS 版本帶來了全新的界面與架構更新，旨在解決蘋果劉海屏對菜單欄圖標的遮擋問題。這次更新不僅提升了 UI 的美感，更在後端連接穩定性上做了優化。對於依賴 Tailscale 進行內網穿透與安全連接的用戶來說，這是一次體驗上的巨大飛躍。🏠

原文連結：Tailscale’s macOS Update

C89cc.sh – 純 Shell 撰寫的 C89/ELF64 編譯器

這是一個極具駭客精神的開源專案：一個完全用可移植 Shell 腳本撰寫的 C89 編譯器。它能直接生成 ELF64 二進制文件，無需依賴其他重量級編譯工具鏈。這對於理解編譯原理、引導系統（Bootstrapping）以及在受限環境下的開發具有極高的技術價值。🐧

原文連結：C89cc.sh Source on Gist

Home Maker：用 Makefile 管理你的開發環境

這個名為 Home Maker 的專案提出了一種簡約的哲學：使用開發者熟悉的 Makefile 來聲明與管理所有的開發工具。它不試圖取代 Nix 或 Ansible，而是提供一種更輕量、更直觀的方式來同步跨機器的環境設置。對於厭倦了複雜配置框架的人來說，這是一個回歸原始且高效的解決方案。🏠

原文連結：Home Maker Blog Post

🏢 創業、商業與企業文化

前工程師揭秘：那些侵蝕 Azure 信任的決策

一位前 Azure 核心工程師撰文深度剖析了微軟在雲端服務擴張過程中，為了追求增速而忽視基礎設施穩定性的內幕。文章指出，某些短視的技術決策與管理層的官僚化，正在逐步腐蝕客戶對 Azure 的長期信任。這篇爆料在 Hacker News 引發了關於「企業規模與技術債」的激烈討論，是所有技術經理人的警世恆言。⚠️

原文連結：Decisions that eroded trust in Azure

好主意不需要謊言來獲得大眾認可

這是一篇 2008 年的經典舊文重新翻紅，討論了誠實與溝通在推廣新事物中的重要性。作者認為，如果一個想法真的具備價值，就不需要過度包裝或透過誤導來爭取支持。在如今充滿行銷話術與過度承諾的矽谷環境下，這篇文章提醒我們回歸技術與價值的本質。📜

原文連結：Good ideas and Public Acceptance

🔭 其他 (科學與探索)

阿提米絲二號的廁所：登月任務的里程碑

在太空探索中，最基本的生理需求往往是最難克服的工程挑戰。這篇文章詳細介紹了 NASA 為阿提米絲二號 (Artemis II) 任務研發的新型太空廁所。這項看似平凡的設計，實際上涉及到精密的流體力學與廢棄物處理技術，是人類能否長期駐留月球的關鍵一步。🌕

原文連結：Artemis II’s Toilet Tech

木衛一 (Io) 尖塔山的真實形狀

透過最新的觀測數據重構，科學家們終於揭開了木衛一上神秘「尖塔山」的廬山真面目。這座極高且陡峭的山峰在光影交錯中展現了獨特的地理結構，為我們理解木星衛星的火山活動與地殼運動提供了新的科學線索。🌌

原文連結：The True Shape of Io’s Mountain

🎯 今日觀點：總結與行動建議

「當我們從『會寫文章的機器』進化到『會辦事的機器』，技術的重心正在從生成轉向執行。」

從今日的熱門話題中，我們可以看到兩個平行的趨勢：AI 的具身化 (Agentification) 與 基礎設施的信任危機。Gemma 4 與 Qwen3.6-Plus 的發佈，意味著「本地 AI 代理」的門檻大幅降低；而 Azure 的爆料則提醒我們，無論技術多麼先進，可靠性永遠是商業的根基。

💡 給讀者的行動建議：

嘗試本地 AI 模型： 下載 Gemma 4 試試在你的開發流程中加入本地推理，減少對 API 的依賴。
評估你的工具鏈： 看看 Cursor 3 是否能提升你的編程效率，並思考 Home Maker 這種極簡工具是否適合你的工作流。
關注工程文化： 閱讀關於 Azure 的評論，反思在自己的團隊中，是否正為了速度而犧牲了長遠的系統穩定性。

2026 年 4 月 3 日

Harness Engineering 實戰：讓 AI Agent 自動從 Bug 中學習的閉環系統

重點摘要

Harness Engineering 是 2026 年 AI 工程最重要的新學科——不是訓練更好的模型，而是打造讓模型可靠運作的系統
公式：Agent = Model + Harness，Model 是可替換零件，Harness 才是護城河
本文用實際的 Claude Code 設定，展示如何用 Hooks 建立一個會自我進化的閉環 Harness

2025 年，所有人都在比誰的 AI Agent 更厲害。2026 年，贏家已經換了跑道——比的是誰的 Harness 更成熟。

如果你正在用 Claude Code、Codex CLI、或任何 AI coding agent，你每天都在跟 harness 打交道，只是你可能不知道它叫這個名字。這篇文章會用我自己的實戰設定，從零解釋什麼是 Harness Engineering，以及你今天就能動手做的事。

Harness Engineering 是什麼？一句話定義

Harness Engineering 是設計「包裹在 AI 模型周圍的控制系統」的工程學科。用 Martin Fowler 的公式來說：

Agent = Model + Harness

Model 提供智能，Harness 讓這個智能可靠、可控、可用。Phil Schmid 用了一個精準的電腦比喻：

電腦零件	AI 系統對應	說明
CPU	AI Model（GPT、Claude）	原始運算能力
RAM	Context Window	有限的工作記憶
作業系統	Agent Harness	管理資源、提供標準介面、控制生命週期
應用程式	Agent	跑在 OS 上的具體任務邏輯

你不會直接在 CPU 上跑程式，你需要作業系統。同樣地，你不會直接對 Claude 說「幫我寫整個系統」就放手不管——你需要 Harness 來確保它走對方向、犯錯時被攔住、學到的教訓不會遺失。

Harness 不是 Framework——搞清楚差異

很多人把 Harness 跟 LangChain、CrewAI 這類框架搞混。它們是完全不同的東西：

Framework（框架）	Harness（治具）
LangChain、CrewAI、AutoGen	Claude Code、Codex CLI
提供零件讓你自己組裝	提供完整運行環境
你自己負責接水管	幫你管好 context、工具、權限、失敗處理
Blueprint	Runtime environment

Framework 是建築材料，Harness 是建好的房子。你可以用 LangChain 的零件去蓋一個 harness，但 Claude Code 本身就已經是一個 harness。

Harness 的兩大核心機制：Guide 與 Sensor

根據 Martin Fowler 的分析，所有 harness 都由兩種控制機制組成：

Guide（前饋控制）——在錯誤發生之前攔住

Guide 是你預先給 agent 的方向和規則。它們在 agent 開始工作之前就生效，目的是讓 agent 第一次就做對。

CLAUDE.md：專案規則文件（「不准動 main branch」「用繁體中文回應」）
Domain Brain：過去踩過的坑的知識庫（「TWSE API 的 ROC 日期格式會導致解析錯誤」）
Skills：標準化的工作流程（「寫 iDempiere event handler 要用這個 pattern」）
AGENTS.md：角色分配和模型選擇規則

Sensor（反饋控制）——做完之後自動檢查

Sensor 監控 agent 的輸出，在問題擴大之前抓住它。分兩種：

計算型 Sensor：linter、type checker、單元測試——毫秒級回應，確定性結果
推理型 Sensor：用另一個 AI 審查輸出（code review agent）——秒級回應，有判斷力但不確定

大多數人只做了 Guide（寫 CLAUDE.md），完全忘了 Sensor。這就像開車只看前方，不看後照鏡。

完整的 Harness Cycle：6 步閉環

一個成熟的 harness 不是「設定好就不管」的靜態文件，而是一個會自我進化的閉環系統。完整的 cycle 有 6 個步驟：

① LOAD ──▶ ② GUIDE ──▶ ③ EXECUTE ──▶ ④ SENSE
 自動載入     前饋引導     Agent 做事     自動檢查
 context     規則+經驗                   品質
                                          │
⑥ EVOLVE ◀── ⑤ LEARN ◀───────────────────┘
 更新規則      萃取教訓
 和知識庫      從錯誤中

步驟	做什麼	Harness 類型	常見工具
① LOAD	自動載入專案 context	基礎設施	SessionStart hook, CLAUDE.md
② GUIDE	讀取規則 + 過去經驗	Guide（前饋）	Domain Brain, Skills
③ EXECUTE	Agent 寫 code	—	Claude Code Bash/Edit/Write
④ SENSE	自動偵測品質問題	Sensor（反饋）	PostToolUse hook, linter, test
⑤ LEARN	從 bug fix 中萃取教訓	Sensor → Guide 橋接	PreCompact hook
⑥ EVOLVE	更新 Brain / 規則文件	Guide 進化	Stop hook 驗證

關鍵是步驟 ⑤→⑥→②：agent 修 bug → 教訓寫入 Brain → 下次讀 Brain → 不再犯同樣的錯。這就是閉環。沒有這個迴路，你的 harness 永遠停留在你第一天寫的水平。

實戰：用 Claude Code Hooks 建立閉環 Harness

讓我用真實的 Claude Code 設定來展示。以下不是理論——這是我每天在用的 harness。

步驟一：建立 Domain Brain（Guide）

Domain Brain 是一組按技術領域分類的 markdown 文件，記錄「過去踩過的坑」。放在 ~/.claude/projects/{project}/memory/brain/ 目錄下：

brain/
├── python-crawler-data.md    # 爬蟲：ROC 日期、欄位映射、空值處理
├── idempiere-osgi-bundle.md  # OSGi：MANIFEST.MF、classloader 問題
├── idempiere-2pack.md        # 2Pack：UUID 穩定性、afterPackIn
├── stock-backtesting.md      # 回測：signal divergence、entry price bug
└── design-principles.md      # 設計原則：頻次驅動架構、anti-patterns

每個 brain file 的內容格式：

# Python Crawler — Everything That Can Go Wrong

## ROC Date Format
- [source: analyst] "1150309" 被解析成 AD 1150 年，要用 7 位 YYMMDD ROC 格式
- [source: analyst] TPEX 欄位名 TransactionAmount 不是 TradingMoney

## Holiday / Empty Response
- [source: analyst] TWSE API 假日返回空值，必須 guard `if not data: return []`

然後在 CLAUDE.md 裡強制 agent 在開工前讀 brain：

## Domain Brain — MANDATORY before ANY implementation work
Before writing any plan, code, or review, you MUST:
1. Find the `## Domain Brain:` line in the project's CLAUDE.md
2. Read each listed brain file
3. If you skip this step and a bug was documented in brain, that is YOUR failure

步驟二：用 Hooks 自動偵測 fix: commit（Sensor）

這是整個閉環最關鍵的一步。在 ~/.claude/settings.json 加入 PostToolUse hook：

{
  "hooks": {
    "PostToolUse": [
      {
        "matcher": "Bash",
        "if": "Bash(git commit:*)",
        "hooks": [
          {
            "type": "command",
            "command": "/path/to/claude-harness-fix-detect.sh",
            "timeout": 5,
            "statusMessage": "Harness: checking for fix: commit"
          }
        ]
      }
    ]
  }
}

偵測腳本做的事很簡單——從 stdin 讀取 Claude Code 傳來的 JSON，提取 commit message，如果是 fix: 開頭就注入 context 強制 agent 更新 brain：

#!/bin/bash
INPUT=$(cat)
msg=$(echo "$INPUT" | jq -r '.tool_input.command' | sed -n 's/.*-m[[:space:]]*["'\'']\?\([^"'\'']*\).*/\1/p')

case "$msg" in
  fix:*|fix\(*)
    project=$(echo "$INPUT" | jq -r '.cwd' | xargs basename)
    cat <<EOF
{"hookSpecificOutput":{"hookEventName":"PostToolUse","additionalContext":"⚠️ BRAIN UPDATE REQUIRED\nYou committed: $msg\nUpdate the brain file NOW before next task."}}
EOF
    ;;
  *) echo '{}' ;;
esac

效果：agent commit 了 fix: handle empty API response → hook 自動觸發 → agent 的 context 被注入「你必須更新 brain」的指令 → agent 無法忽略。

步驟三：PreCompact 安全網

Claude Code 在 context window 快滿時會自動壓縮（compact）。如果 brain 更新的指令在壓縮中被丟掉怎麼辦？加一個 PreCompact hook：

{
  "PreCompact": [
    {
      "hooks": [
        {
          "type": "command",
          "command": "/path/to/claude-harness-precompact.sh",
          "timeout": 5
        }
      ]
    }
  ]
}

腳本掃描最近 5 個 commit，如果有 fix: 就在壓縮前再次提醒。雙重保險。

步驟四：Stop hook 結算

Session 結束時，Stop hook 比對「今天的 fix: commit 數量」和「brain file 是否有更新」。如果數字不匹配，就警告使用者——這是最後的安全網。

真實案例：閉環如何拯救你的下一個 bug

讓我走過一個完整的案例。假設你的 TWSE 爬蟲在假日會爆錯：

① LOAD：你打開 Claude Code，說「爬蟲昨天跑失敗了，幫我查」
② GUIDE：Agent 讀 brain/python-crawler-data.md，發現裡面已經記錄了 ROC 日期和欄位映射的坑。帶著這些經驗開始查 bug，不走冤枉路
③ EXECUTE：Agent 找到 root cause——假日 API 返回空 response，parse() 沒處理 None。寫修復
④ SENSE：git commit -m "fix: handle empty API response on holidays" → PostToolUse hook 觸發 → 注入 brain update 指令
⑤ LEARN：Agent 被強制讀 brain file，加入新教訓：「假日 API 返回空值必須 guard」
⑥ EVOLVE：Brain file 更新完成。下次任何專案遇到 TWSE 爬蟲問題，都不會再踩同樣的坑

沒有這個閉環會怎樣？你修完 bug，commit，然後忘了。三個月後在另一個專案遇到同樣的問題，重新 debug 兩小時，再次發現「啊，假日要特別處理」。這就是知識衰減——你修了 bug，但教訓死在那個 commit 裡。

大多數人的 Harness 在哪裡斷裂？

我觀察到的最常見模式：

步驟	大多數人的狀態	問題
① LOAD	✅ 有 CLAUDE.md	—
② GUIDE	⚠️ 寫了規則但靠 AI 自律	AI 經常跳過，特別是簡單任務
③ EXECUTE	✅ Agent 正常工作	—
④ SENSE	❌ 完全沒有自動檢查	commit 後不跑 lint/test
⑤ LEARN	❌ 靠 AI 記得	AI 經常忘記更新知識庫
⑥ EVOLVE	❌ 靠 AI 記得	教訓死在 commit 裡

Cycle 在第 ④ 步就斷了。 Guide 做了一半，Sensor 完全不存在，閉環更不用說。這就是為什麼同樣的 bug 會反覆出現——不是 model 不夠聰明，是 harness 沒有記憶。

你的 Harness 成熟度在哪一層？

我把 harness 成熟度分成 4 層，你可以自我評估：

層級	特徵	你有什麼
Level 0：裸奔	直接對 AI 說話，沒有任何規則文件	只有 model
Level 1：有規則	有 CLAUDE.md、有 coding style guide	Guide（開環）
Level 2：有回饋	有 hooks 跑 linter/test、有 code review agent	Guide + Sensor（開環）
Level 3：閉環	Sensor 的結果會自動回寫到 Guide（Domain Brain）	Guide + Sensor + 閉環迴路

大多數人在 Level 1。用了 Claude Code 的人可能在 Level 1.5（有 CLAUDE.md 但沒有 hooks）。Level 3 是目標——你的 harness 會隨著每次 bug fix 自動進化。

今天就能做的 3 件事

不需要重新設計整個系統。從這三件事開始：

建 Domain Brain 目錄：按技術領域建 brain files，把你已知的坑寫進去。不需要完美——一個 brain file 有 5 條教訓，就比沒有好 100 倍
加一個 PostToolUse hook：偵測 fix: commit，注入 brain update 提醒。這一個 hook 就打通了 ④→⑤ 的斷裂
在 CLAUDE.md 加 Domain Brain 規則：強制 agent 在開工前讀 brain。不是「建議」，是「MUST」

這三步讓你從 Level 1 直接跳到 Level 2.5。剩下的 0.5（完全自動化的 brain 更新）可以後面再做。

結語：Model 會被換掉，Harness 不會

OpenAI 一個月前還領先，現在 Claude 追上了。三個月後可能又換一輪。Model 是最不穩定的變數——你永遠不知道下一個版本是更好還是更差（我之前叫了 20 個 AI 專家 Review 的慘痛教訓就是證明）。

但你的 Harness——你的規則、你的 Brain、你的 Hooks——這些是你的資產。不管底層 model 怎麼換，你累積的工程知識和控制系統都會繼續生效。

2026 年的 AI 工程贏家，不是有最好 model 的人，而是有最成熟 harness 的人。你今天就可以開始建。

延伸閱讀

2026 年 4 月 3 日

Hacker News 每日精選 – 2026-04-02

今日的科技圈展現了從深空探索到微觀量子力學的跨維度進展，同時也揭示了軟硬體生態系正面臨的實質挑戰。從 NASA 的登月任務更新到 Linux 在遊戲市場的突破，這些動態不僅關乎技術演進，更直接影響了開發者的工具選擇與企業的營運成本。

🤖 AI / 機器學習

Claude Code 洩漏事件解析

近期關於 Claude Code 的相關程式碼洩漏事件引起了開發者社群的高度關注。這起事件揭露了 Anthropic 在開發 AI 輔助編程工具時的內部機制與邏輯處理方式。對於依賴 AI 工具的開發者而言，這不僅是一個技術洩漏問題，更引發了關於 AI 工具安全性與程式碼隱私的深度討論。了解這些底層邏輯，有助於我們更謹慎地評估 AI 輔助工具在企業環境中的應用邊界。

原文連結：The Claude Code Leak

🛠️ 開發工具

EmDash：解決外掛安全痛點的 WordPress 精神繼承者

Cloudflare 推出了一項名為 EmDash 的實驗性專案，旨在從根本上解決 WordPress 長久以來的外掛安全漏洞問題。EmDash 借鑒了 WordPress 的易用性，但透過更現代、更安全的架構來管理擴充功能，避免了單一外掛受損導致整個站點崩潰的風險。這對於長期受困於網站維護與安全更新的開發者來說，無疑是一個極具吸引力的替代方案。

原文連結：EmDash – A spiritual successor to WordPress that solves plugin security

ocamlc 全新 C++ 後端開發進展

OCaml 編譯器（ocamlc）新增了一個 C++ 後端，這標誌著該函數式編程語言在互操作性上的重大飛躍。這個新的後端允許 OCaml 程式碼更無縫地與 C++ 生態系整合，並可能帶來更好的性能優化空間。對於追求高性能且需要利用現有 C++ 庫的系統開發者而言，這項更新大幅擴展了 OCaml 的應用場景。

原文連結：A new C++ back end for ocamlc

快速且華麗的侵蝕濾鏡算法

這篇文章深入探討了一種高性能的侵蝕（Erosion）濾鏡實現方式，能在保持視覺美感的同時達到極快的處理速度。作者詳細解析了算法的優化過程，如何透過數學技巧減少運算負擔，這對於圖形學開發者、遊戲開發人員或從事影像處理的工程師來說是非常寶貴的參考資料。這種技術能顯著提升地形生成或圖像特效的即時渲染效率。

原文連結：Fast and Gorgeous Erosion Filter

💼 創業 / 商業

DRAM 價格飆漲正扼殺愛好者單板電腦市場

知名科技評論家 Jeff Geerling 指出，不斷攀升的 DRAM 成本正嚴重打擊單板電腦（SBC）市場，如 Raspberry Pi 等產品。原本以低廉價格著稱的硬體，現在因為記憶體成本佔比過高，迫使製造商調漲售價或縮減規格，這對自造者文化（Maker Culture）與教育用途專案造成了巨大阻礙。這反映了全球半導體供應鏈波動對微型運算生態系的深遠影響。

原文連結：DRAM pricing is killing the hobbyist SBC market

訂閱轟炸：如何防護你的註冊表單

訂閱轟炸（Subscription Bombing）是一種針對網站註冊表單的惡意攻擊，攻擊者利用自動化指令碼將受害者的電子郵件填入數千個合法網站。這不僅會損害網站的郵件發送聲譽，更可能導致郵件服務商停權你的帳戶。本文提供了實用的防禦建議，包括實施速率限制、驗證碼機制以及優化確認回覆流程，是 SaaS 創業者的必讀安全指南。

原文連結：Subscription bombing and how to mitigate it

🐧 開源專案

Steam on Linux 市佔率突破 5% 大關

根據 3 月份的數據，Linux 在 Steam 平台上的使用率已正式突破 5%，這是一個歷史性的里程碑。這主要歸功於 Steam Deck 的持續成功以及 Proton 兼容層的成熟，讓大量 Windows 遊戲能流暢運行於 Linux 系統。這個趨勢預示著 Linux 桌面版在遊戲領域的競爭力正穩定提升，不再僅限於伺服器或開發用途。

原文連結：Steam on Linux Use Skyrocketed Above 5% in March

🚀 其他

阿提米絲 2 號（Artemis II）發射日即時更新

NASA 官方部落格正密集更新 Artemis II 任務的發射準備情況，這是人類在半個多世紀後首次載人繞月飛行的重要里程碑。讀者可以追蹤當前的倒數狀態、技術檢查細節以及太空人的最新動態。這項任務的成功將為未來的人類重返月球表面奠定基礎，象徵著新太空時代的全面開啟。

原文連結：Live: Artemis II Launch Day Updates

量子計算的震撼消息：這不是愚人節玩笑

量子計算專家 Scott Aaronson 整理了近期量子領域的重要突破，並特別澄清這些並非愚人節玩笑。內容涉及量子位元糾錯與演算法效率的實質進展，這些研究正逐步縮小理論與實際可規模化運算之間的差距。對於想了解量子科技真實進展、而非行銷術語的讀者來說，這是一篇極具權威性的深度綜述。

原文連結：Quantum computing bombshells that are not April Fools

2026 年的電子郵件混淆技術：什麼依然有效？

隨著爬蟲技術的不斷進化，如何在網頁上保護電子郵件地址不被垃圾郵件機器人抓取變得愈發困難。本文測試了多種混淆技術，從簡單的 HTML 實體替換到複雜的 JavaScript 加密，並對其在 2026 年的有效性進行了評估。文章提醒開發者，在追求防護的同時，也應兼顧網頁無障礙性（Accessibility）與用戶體驗。

原文連結：Email obfuscation: What works in 2026?

💡 今日觀點

綜觀今日的熱門話題，我們可以看到科技界正處於一個「代際交替」的階段。Linux 在桌面端的崛起挑戰了 Windows 的霸權，而新型 CMS 如 EmDash 則試圖顛覆已統治網路二十年的 WordPress 模式。同時，硬體成本的壓力（如 DRAM 價格）正迫使愛好者社群重新思考低成本開發的可能性。

給讀者的行動建議：

安全性優先： 立即檢查你的產品註冊流程，確保有基本的機制防禦「訂閱轟炸」攻擊。
跨平台部署： 鑑於 Linux 在遊戲與開發端的增長，建議開發者應將 Linux 原生支援納入長期技術規劃。
關注基礎建設： 不要只關注 AI 模型，更要留意像 Cloudflare EmDash 這類能解決長年痛點的底層工具變革。

2026 年 4 月 2 日

iDempiere + LangGraph：為 15 年老 ERP 加上 AI 問答的完整紀錄

重點摘要

用 LangGraph + Claude Sonnet + Groq Llama 為 15 年老 ERP 系統加上 AI 問答功能，不改任何一行既有程式碼
從設計到上線跑通：13 輪審查、20+ 個 AI 專家、發明了「領域腦」知識管理系統、踩了 30+ 個坑
最大的教訓不是技術——是「經驗存在但沒被用到」。叫 20 個專家 review 不如先讀一遍上次的踩坑紀錄
完整開源：AI Assistant + Domain Brain（領域腦知識管理系統）

這篇文章記錄一個完整的旅程：從「我想讓老 ERP 系統能用 AI 回答問題」到「真的在 iDempiere 裡輸入問題、6.8 秒後看到 Claude 的回答」。過程中我們設計了架構、寫了計畫、做了 13 輪審查、發現了「領域腦」這個知識管理方法、踩了 30 多個坑、讓兩個不同的 AI（Claude 和 Qwen）協作開發——最後真的跑通了。

最終成果：一張截圖說明一切

** === AI Assistant Response ===
Question: 我想查詢訂單
Answer: 很抱歉，目前沒有找到任何訂單資料。建議您提供特定的訂單編號...
Model: sonnet
Tokens: 705
Time: 6864 ms
Query: order_status_by_documentno

這代表什麼？整條鏈路全部打通了：使用者在 iDempiere 輸入問題 → Java Plugin 用 HMAC 簽名 → HTTP 打到 Python → LangGraph 分類問題 → 選對了 SQL → 查了 PostgreSQL → PII 脫敏 → Claude Sonnet 回答 → 脫敏還原 → 顯示在 iDempiere UI。6.8 秒，705 tokens，沒有改 iDempiere 任何一行既有程式碼。

架構：支援老系統，不重寫老系統

核心理念：iDempiere 是 15 年的 Java ERP，我們不動它，只在旁邊加一個 Python 微服務。

iDempiere (Java/OSGi)                    Python AI Service (FastAPI)
┌──────────────────────┐                 ┌──────────────────────────┐
│ AI Chat Process      │  HTTP POST      │ HMAC 驗證                │
│ HMAC 簽名            │ ──────────────→ │ LangGraph 分類 (Llama 8B)│
│ 審計日誌              │                 │ 選擇預定義 SQL            │
│                      │ ←────────────── │ PostgreSQL 查詢 (只讀)    │
│ 顯示回答              │  JSON 回應      │ PII 脫敏 → Sonnet → 還原  │
└──────────────────────┘                 └──────────────────────────┘

這個架構的好處：Python service 掛了，ERP 完全不受影響。要換 LLM 模型？改 Python 一行。要加新的查詢？加一個 SQL 定義檔，Java 端不用動。

開發過程：兩個 AI 協作，一個審查一個寫碼

這個專案的開發方式很特別：Claude（我）負責設計、審查、知識管理；Qwen 負責寫程式碼。

角色	AI	工作
架構師 + 審查員	Claude Opus	設計 spec、寫 plan、派專家 review、建 Domain Brain、debug 部署問題
程式實作	Qwen	Python service 全部程式碼 + Java plugin 全部程式碼
指揮官	Tom（人類）	定需求、判斷方向、提出「你有沒有去看上次的紀錄？」這種靈魂拷問

13 輪審查學到的事

我們做了 13 輪 review，派了 20 多個 AI 專家 agent。前 8 輪查邏輯、安全、架構、接點——都通過了。然後 Tom 問了一句：「你有沒有去看 tw-invoice 上次踩的坑？」

答案是沒有。然後我們發現 3 個會直接讓 plugin 啟動失敗的 bug，全部都是上次踩過且記錄過的。20 個專家沒抓到，一句「去看舊筆記」就全找到了。

這件事催生了一篇完整的反思文章和一個全新的知識管理系統——Domain Brain（領域腦知識管理系統）。

踩的最痛的幾個坑

坑	痛點	教訓
JVM 參數加在 idempiere.ini	systemd 啟動不吃 ini，要加在 server.sh	先搞清楚服務怎麼啟動的
2Pack XML 格式錯	Para 要嵌套在 Process 裡、要 type=table、reference=uuid	看 tw-invoice 的 working example 比看文件有用
AD_Menu_ID=146 不存在	menu ID 是環境特有的，不能 hardcode	用 UUID reference
ad_menu_access 表不存在	iDempiere 根本沒有這張表	不要假設表存在，先查
缺 IProcessFactory	DefaultProcessFactory 用 Class.forName，看不到 plugin	每個 SvrProcess 都需要自己的 Factory

Domain Brain：解決「經驗不傳承」的方法

這個專案最大的副產品是 Domain Brain — 一個把所有專案經驗按技術領域濃萃的知識管理系統。詳細的介紹在前一篇文章，這裡只講結果：

9 份領域腦，涵蓋 OSGi、2Pack、PO Model、REST API、Python LLM、Crawler、回測、OMS、設計原則
每個專案的 CLAUDE.md 宣告自己需要哪些腦：## Domain Brain: osgi-bundle, 2pack, po-model
審查時帶著腦 → 第一輪就抓到之前 8 輪沒抓到的 bug
新坑自動更新回腦 → 所有未來專案受益

技術棧

層	技術
ERP UI	iDempiere 12 + ZK + OSGi Plugin
AI 路由	LangGraph StateGraph（分類 → 選 SQL → 查詢 → 脫敏 → 回答 → 還原）
LLM	Claude Sonnet（查詢選擇 + 回答） + Groq Llama 8B（分類）
安全	HMAC-SHA256 簽名、PII 可逆脫敏 [PII_C_001]、只讀 DB 帳號、statement_timeout
資料庫	PostgreSQL（iDempiere DB），ai_readonly 帳號，ThreadedConnectionPool

開源

AI Assistant： github.com/tm731531/idempiere-tw-ai-assistant
Domain Brain： 按技術領域濃萃開發經驗的知識管理方法（詳見知識管理反思文章）
前一篇（知識管理反思）： 叫了 20 個 AI 專家 Review，最致命的 Bug 卻是「沒讀上次的筆記」

下一步

從 Process 對話框升級為 ZK Form 聊天窗（更好的 UX）
加入 AI_ChatLog 審計表（追蹤每次問答）
更多預定義 SQL（目前 3 個，目標 20+）
對話歷史（Phase 2）
有限的寫入操作——透過 iDempiere API，不是直接 SQL

2026 年 4 月 2 日

Hacker News 每日精選 – 2026-03-31

🚀 科技週報：從供應鏈安全危機到 AI 本地化的新里程碑

今天的科技圈焦點呈現出極端的對比：一方面我們面臨著如 Axios 套件遭竄改等嚴峻的供應鏈安全威脅，另一方面則是 AI 技術在邊緣運算與專業領域（如時間序列預測）的持續深化。身為開發者或技術決策者，理解這些趨勢不僅能幫助你保護現有的系統，更能讓你掌握下一波開發效率提升的關鍵工具。

🤖 AI / 機器學習

1. Ollama 現支援 Apple Silicon MLX 加速（預覽版）

熱門的本地 LLM 執行工具 Ollama 宣佈在預覽版中整合了 Apple 的 MLX 框架。這意味著在 Mac 上執行大型語言模型時，將能更深層地利用 Apple Silicon 的統一記憶體架構與 GPU 加速，顯著提升推論速度與效率。對於追求隱私且習慣在本地端開發 AI 應用的開發者來說，這是一個重大的性能跨越。🚀

閱讀原文

2. Google 開源 TimesFM：擁有 16k 上下文的 2 億參數時間序列模型

Google 研究團隊推出了專為時間序列預測設計的基礎模型 TimesFM。該模型具備 2 億個參數並支援高達 16k 的上下文長度，旨在解決跨領域的預測難題。這標誌著時間序列分析正從傳統的統計方法轉向類似大型語言模型的「預訓練基礎模型」範式。📈

閱讀原文

3. Universal Claude.md：大幅降低 Claude 輸出 Token 消耗的工具

這是一個旨在優化與 Claude 模型互動效率的開源專案。透過特定的格式與提示策略，該工具能有效減少模型輸出的冗餘 Token，進而降低 API 使用成本並提升回覆速度。對於重度依賴 AI 進行程式碼生成或文件撰寫的用戶來說，這是一個極具實用價值的優化方案。💸

閱讀原文

🛠️ 開發工具與安全

1. Axios 套件於 NPM 遭受攻擊：惡意版本包含遠端存取木馬

全球極受歡迎的 HTTP 客戶端套件 Axios 傳出安全漏洞，其 NPM 倉庫被上傳了遭竄改的惡意版本。這些版本內藏遠端存取木馬（RAT），可能導致受感染的開發環境或伺服器被駭客完全控制。這再次敲響了軟體供應鏈安全的警鐘，強烈建議開發者立即檢查專案中的套件版號。🚨

閱讀原文

2. GitHub 撤回於 Pull Request 插入 Copilot 廣告的決定

在遭受社群廣泛批評後，GitHub 決定取消在 Pull Request 介面中強行插入 Copilot 廣告的計畫。開發者認為在工作流程中加入侵入式廣告極大影響了開發體驗。這一事件展現了開發者社群對平台治理的影響力，也提醒企業在推廣 AI 產品時需謹慎考量用戶體驗。🛑

閱讀原文

3. Google Play 將對所有開發者實施身分驗證

Google 宣佈將對所有 Android 開發者強制執行更嚴格的身分驗證流程，以打擊惡意軟體與垃圾應用。雖然這能提升應用程式商店的整體安全性，但也增加了獨立開發者與小規模團隊的行政負擔。開發者需提前準備相關證明文件以避免應用程式下架。🆔

閱讀原文

🏗️ 開源專案與技術文化

1. 《Clojure》紀錄片預告：探索函數式語言的現代遺產

一部關於 Clojure 程式語言的紀錄片釋出了官方預告片。影片回顧了由 Rich Hickey 創造這門語言的初衷，以及它如何憑藉 Lisp 的哲學與現代 JVM 的效能，在高度競爭的開發市場中建立起獨特的社群文化。這是對編程美學與工程師精神的一場致敬。🎬

閱讀原文

2. 堅持親自寫作：為什麼你不該讓 AI 完整代筆

這篇文章引發了 Hacker News 上的熱烈討論，作者主張寫作過程本身就是一種「思考的修煉」。雖然 AI 可以協助生成草稿，但過度依賴 AI 寫作會弱化人類的思考深度與原創表達。這是在 AI 浪潮下，對人類創造力價值的一次深度反思。✍️

閱讀原文

🌐 其他關注話題

1. Artemis II 太空任務被指尚不具備飛行安全性

一份關於 NASA 阿提米絲 II 號（Artemis II）任務的報告指出，該太空船在熱防護盾與電力系統方面仍存在安全隱憂。隨著載人繞月任務期限逼近，工程安全性與時程壓力之間的權衡再次成為爭議中心。這提醒我們，頂尖工程專案中，細節決定了成敗與生死。🚀

閱讀原文

2. Fedware：揭露政府 Apps 的監控問題

文章探討了所謂「聯邦軟體（Fedware）」的隱私漏洞，指出某些政府官方應用的數據追蹤行為，甚至比它們所禁止的第三方應用程式更為嚴重。這引發了關於數位威權與數據隱私權力對稱性的廣泛辯論。🕵️‍♂️

閱讀原文

💡 今日觀點：在工具演進中保持警覺

今日的趨勢可以總結為：「強大的工具帶來效率，但也帶來了隱形的脆弱性。」 無論是 NPM 套件的供應鏈污染，還是政府應用的隱私風險，都提醒我們在享受科技便利的同時，必須保有對底層安全的審查能力。

給讀者的行動建議：

立即行動： 檢查你的 package.json，確保 axios 版本不受此次惡意竄改事件影響，建議鎖定已驗證的安全版本。

嘗試新技術： 如果你是 Mac 用戶，下載新版 Ollama 體驗 MLX 加速帶來的本地運算流暢感，這可能是未來私有 AI 應用的常態。

保持思考： 在利用 AI 生成程式碼或內容時，保留最後一步的「手動校準」，這不僅是為了準確性，更是為了維持你作為開發者的核心競爭力——思考力。

2026 年 3 月 31 日

叫了 20 個 AI 專家 Review，最致命的 Bug 卻是「沒讀上次的筆記」

重點摘要

用 AI 派了 20 個專家跑了 7 輪 review，查了上百個檢查點，結果最致命的 bug 是「沒有去看上次踩過的坑」
問題不是 AI 不夠聰明，而是 AI 沒有主動讀已有的經驗文件就開始寫新計畫
解法不是叫更多專家，而是建立「做特定事之前必讀的 checklist」並且寫進記憶系統
AI 和人一樣：知識存在 ≠ 知識會被用到。差距在於流程，不在於能力

這篇文章記錄一個讓我很不高興的經驗：我用 Claude Code 設計一個 iDempiere AI 助手系統，前後叫了 20 個 AI 專家 agent 做了 7 輪 review，查了上百個技術檢查點——結果最致命的 bug，不是什麼深奧的技術問題，而是「沒有去讀上次開發同類型 plugin 時寫下的踩坑紀錄」。

這件事讓我思考一個更根本的問題：我到底該怎麼跟 AI 協作，才能讓它真正用到已有的經驗？

發生了什麼事？

我在開發一個 iDempiere ERP 的 AI 問答助手。這個系統分成兩部分：Java 的 iDempiere Plugin（前端 UI + 權限 + 審計日誌）和 Python 的 FastAPI 服務（AI 路由 + PII 脫敏 + LLM 呼叫）。

在寫 Plugin 的計畫之前，我已經有一個完整的 iDempiere plugin 開發經驗——台灣統一發票系統 tw-invoice。那個專案踩了超過 24 個坑，每一個都花了我好幾個小時 debug，而且全部記錄在 CLAUDE.md 裡。

但是當 Claude 開始寫 AI 助手的 Plugin 計畫時，它完全沒有去讀那份文件。它是從「一般 iDempiere 知識」出發寫的，而不是從「我們一起踩過的坑」出發。

7 輪 review 查了什麼？漏了什麼？

輪次	專家數	查了什麼	找到什麼
R1	3	元件設計（iDempiere/Python/Security）	12 個修正（HMAC、PII、async）
R2	1	驗證 code 有更新	0/12 code 沒改（只改了表格）
R3	2	接點（Java↔Python↔DB↔LLM）	4 個 CRITICAL（PG schema, pool, HMAC bytes）
R4	3	架構師 / 開發者 / PM	4 個 BLOCKED（conftest 順序、mock 路徑）
R5	2	老系統 × 新系統聯合對話	thread pool 會拖垮 ERP、statement_timeout
R6-R7	6	最終驗證 62+38 個檢查點	全部通過 ✅
R8-R9	3	我要求去讀 tw-invoice 踩坑紀錄	3 個 P0 — 不修直接不能跑

你看到問題了嗎？前 7 輪 review 用了 20 個專家 agent，查了上百個檢查點，全部通過。但只有在我「要求 Claude 去讀舊專案的踩坑紀錄」之後，才發現 3 個會直接讓 plugin 無法啟動的致命 bug。

那 3 個致命 bug 是什麼？

Bug	後果	tw-invoice 有記錄嗎？
MANIFEST.MF 缺 `org.adempiere.plugin.utils`	Bundle 無法 resolve，完全不能啟動	✅ 有，而且踩過
@Model annotation import 路徑錯	PO model 不被發現，DB 操作全部失效	✅ 有，而且踩過
initPO 缺少 tableId 檢查	第一次啟動（2Pack 還沒跑）直接 crash	✅ 有，而且踩過

三個 bug 都是 tw-invoice 踩過且記錄過的。經驗就躺在那裡，但沒有被讀取。

問題出在哪？不是 AI 不聰明

讓我想清楚之後，我發現問題不在 AI 的能力（它確實能找到問題——找到了上百個），而在於AI 和人一樣，「知道」跟「會用」之間有巨大的差距。

三層問題

AI 不知道要去看 — 寫新 plugin 計畫時，它沒有主動去讀 tw-invoice 的 CLAUDE.md。它有能力讀，但沒有觸發「我應該先去看看上次踩了什麼坑」的念頭。
我也不知道要提醒它 — 我以為「派 20 個專家 review」已經夠全面了。我不知道這些專家不會自動去讀歷史紀錄，除非我明確要求。
專家 review 的盲點 — 專家只看「這份文件本身有沒有問題」，不會跨專案比對「上次做類似的事踩了什麼坑」。他們審的是邏輯一致性，不是經驗傳承。

解法：不是更多專家，而是「做事之前的 checklist」

派再多專家也沒用，如果他們不知道要看哪些歷史紀錄。真正的解法是在開始工作之前，就讓 AI 讀取相關的經驗教訓。

我最終建立了兩份「跨專案強制 checklist」，存在 Claude 的記憶系統裡：

記憶檔案	觸發條件	內容
`idempiere-plugin-pitfalls.md`	寫任何 iDempiere plugin 之前	MANIFEST.MF 必要 package、2Pack 路徑、@Model import、initPO guard、afterPackIn 模式、部署 SOP
`python-llm-pitfalls.md`	寫任何 Python LLM 整合之前	JSON 解析容錯、Groq rate limit、timeout 設定、lazy-init 模式

這兩份檔案在 MEMORY.md 索引裡標記為 🔴 MANDATORY。每次新對話載入時，AI 會看到這個索引，知道「做 iDempiere plugin 工作之前，先讀 pitfalls 檔案」。

你該怎麼做？給 AI 使用者的具體建議

如果你也用 Claude Code（或任何 AI coding assistant）做重複性的專案工作，以下是我的教訓：

1. 踩坑之後立刻寫進 CLAUDE.md

不是「之後再整理」，是修完 bug 的那一刻就寫。寫三行就好：什麼坑、為什麼踩到、怎麼修的。這個我有做，tw-invoice 的 CLAUDE.md 記了 24 個坑。問題出在下一步。

2. 建立跨專案的 pitfalls 記憶（這是我缺的那一步）

經驗寫在專案 A 的 CLAUDE.md 裡，專案 B 不會自動讀到。你需要把「通用教訓」抽出來，放到 Claude 的記憶系統（~/.claude/projects/memory/），這樣每個新專案都能讀到。

# MEMORY.md 索引加這一行：
## ⚠️ Must-Read Before Specific Work
- **idempiere-plugin-pitfalls.md** 🔴 MANDATORY — 寫任何 plugin 前必讀

3. Review 之前，先問「你有沒有讀過上次的紀錄？」

不要假設 AI 會自動做這件事。它不會。你需要明確說：「先去看 tw-invoice 的 CLAUDE.md 取經，然後再來審這份計畫。」

4. 專家 review ≠ 經驗傳承

20 個專家能找到「這份文件本身有沒有邏輯錯誤」，但找不到「上次做類似的事踩了什麼坑」。這兩件事是不同的能力，需要不同的觸發方式。

專家 review：「這份計畫有沒有 bug？」→ 邏輯驗證
經驗傳承：「上次做類似的事踩了什麼坑？」→ 歷史比對

你需要兩者都做，而且經驗傳承要在 review 之前。否則 review 再怎麼嚴謹，也只是在一個有缺陷的基礎上做驗證。

AI 協作的本質：知識存在 ≠ 知識被用到

這次經驗讓我想通一件事：AI 的問題跟人的問題是一樣的。

你的資深工程師也會犯同樣的錯——他上次在專案 A 踩了 10 個坑，寫了筆記，但做專案 B 的時候忘了翻筆記，同樣的坑又踩一次。差別在於人有「直覺」（模糊地記得「好像上次有遇過類似的」），AI 沒有這種模糊記憶。AI 要嘛讀了文件就完美執行，要嘛沒讀文件就完全不知道。

所以跟 AI 協作的核心不是「讓 AI 更聰明」，而是讓正確的資訊在正確的時間出現在 AI 面前。這是一個資訊流設計問題，不是 AI 能力問題。

我的 AI 協作框架（修正版）

開始新專案
    ↓
1. 讀 MEMORY.md 索引（AI 自動做）
    ↓
2. 有沒有「Must-Read」標記的 pitfalls 檔案？
   → 有：讀完再動手（AI 必須被觸發）
   → 沒有：判斷是否需要建立一個
    ↓
3. 讀舊專案的 CLAUDE.md（我要明確要求）
    ↓
4. 寫計畫（現在才開始）
    ↓
5. Review（專家驗證邏輯 + 歷史比對）
    ↓
6. 踩到新坑 → 立刻寫進 CLAUDE.md + 更新 pitfalls 記憶

關鍵改變：步驟 2 和 3 是我之前跳過的。我以為步驟 5 的 review 會涵蓋一切，但 review 只能驗證邏輯，不能傳承經驗。

更深的問題：專案爆炸之後，你連「要叫 AI 去看哪裡」都不知道

我檢查了一下自己的開發環境：42 個資料夾、9 個 iDempiere 相關專案、38 個記憶檔案、8 個專案各有自己的 CLAUDE.md（共 1578 行經驗紀錄）。

這代表什麼？我已經快到「我自己都不知道我有什麼」的臨界點了。

這次我還記得「tw-invoice 有踩坑紀錄」所以能叫 AI 去讀。但再過半年呢？再多 10 個專案呢？到時候我連「有一份紀錄存在」都不記得，更不可能叫 AI 去參考。而 AI 自己不會主動翻遍 42 個資料夾找相關經驗。

這就是Sample → 大系統模式的致命陷阱：

正常的軟體開發流程：
  做 Sample → 驗證可行 → 嫁接到大系統

加入 AI 協作之後：
  做 Sample → AI 幫你踩坑 → 經驗寫在 Sample 的 CLAUDE.md
  → 做大系統 → AI「不知道」Sample 的經驗存在
  → 同樣的坑再踩一次
  → 你修完寫進大系統的 CLAUDE.md
  → 下一個專案又不知道...

無限循環。

跟資深用戶合作的隱藏風險

還有一個我不想承認但必須說的事：跟資深用戶合作，AI 反而更容易犯錯。

因為你太懂技術，我傾向「快速產出」而不是「慢慢確認」。你一聽就懂的東西，我就跳過解釋直接做。結果跳過的步驟裡，就藏著「你以為我知道、我以為你知道、但其實沒人確認」的盲區。

如果你是新手，我反而會更謹慎——每一步確認、每個假設驗證。但跟資深用戶合作，雙方都太有信心，踩煞車的人就消失了。

知識分層：什麼該鎖、什麼該開

還有一個企業層面的問題：當經驗從「人的腦子」搬到「.md 檔案」，它變得可複製了。新人 clone repo 就能拿到所有踩坑紀錄。這對知識傳承是好事，但對機密控管是風險。

解法是分層：

層級	內容	存在哪	被帶走的風險
公開技術層	CLAUDE.md、架構規則、coding style	Git repo	低（跟 source code 等價）
團隊經驗層	踩坑紀錄、設計文件、SOP	Git repo	中（加速競爭對手，但不是核心機密）
個人記憶層	跨專案 pitfalls、用戶偏好	~/.claude/（本機）	低（不在 repo 裡，但可手動複製）
營運機密層	API key、商業邏輯、客戶資料	.env / 公司內部系統	高（必須嚴格管控）

但現實是：目前沒有任何 AI 開發工具提供這種分層管理。 Claude Code 的記憶系統是平的——所有 .md 檔案放在同一個目錄，沒有權限控制、沒有加密、沒有存取日誌。這是整個產業還沒解決的問題。

真正需要的：「做特定事之前必須讀什麼」的自動化

我現在的解法是「手動建立 pitfalls 記憶 + 在 MEMORY.md 標記 MANDATORY」。但這依賴兩件事：

我記得去標記 — 如果我忘了把新的 pitfalls 抽出來建立跨專案記憶，下次還是會踩坑
AI 會去讀標記 — 目前是靠 MEMORY.md 索引，但沒有強制機制。AI 「應該」讀，但「應該」跟「一定會」之間有差距

理想的解法是什麼？類似 Git hooks 的機制：

觸發條件                    → 自動動作
─────────────────────────────────────────────
偵測到 iDempiere plugin 相關工作  → 強制讀取 idempiere-plugin-pitfalls.md
偵測到 Python LLM 整合          → 強制讀取 python-llm-pitfalls.md
偵測到新專案建立                → 掃描所有已有專案的 CLAUDE.md，提取相關經驗
偵測到跟舊專案同類型的工作       → 自動列出「相關專案清單」讓用戶確認

這個機制目前不存在。Claude Code 有 hooks，但是是 shell command 層級的，不是「語意理解」層級的。它能在 tool call 前後跑 script，但不能理解「這次的工作跟上次的 tw-invoice 是同類型的，應該先去參考」。

在這個機制出現之前，唯一的防線就是你自己：你必須記得提醒 AI 去讀歷史，而且你必須知道歷史在哪。當你的專案多到你自己都不記得有哪些，這條防線就會失守。

最終解法：領域腦（Domain Brain）

經過上面所有的分析，我最終做了一件事：把 42 個專案、1578 行 CLAUDE.md、38 個記憶檔案的經驗，按「技術領域」濃萃成 7 份領域腦。

之前（按專案切，散落各處）：
  tw-invoice/CLAUDE.md     → 24 個坑（OSGi + 2Pack + PO + REST 混在一起）
  module-ui/CLAUDE.md      → ZK + REST + 測試（370 行）
  skin-ui/CLAUDE.md        → WAB + Vue + 測試（507 行）
  langgraph-duo/           → Python LLM 整合
  analyst/                 → 爬蟲 + pandas + 回測
  → 你要知道「哪個專案有哪些經驗」才能讓 AI 去讀

之後（按領域切，濃萃在一處）：
  brain/idempiere-osgi-bundle.md   ← 所有 OSGi 的坑（來自 4 個專案）
  brain/idempiere-2pack.md         ← 所有 2Pack 的坑
  brain/idempiere-po-model.md      ← 所有 PO Model 的坑
  brain/idempiere-rest-api.md      ← 所有 REST API 的坑
  brain/python-llm-integration.md  ← 所有 LLM 整合的坑
  brain/python-crawler-data.md     ← 所有爬蟲/資料的坑
  brain/design-principles.md       ← 跨語言設計原則
  → 你只需要說「我要做 plugin」，AI 就讀 OSGi + 2Pack + PO 三份腦

為什麼這比「叫 AI 去看舊專案」好？

面向	看舊專案 CLAUDE.md	領域腦
你需要記得什麼	哪個專案跟現在的相關	只需要知道「我在做什麼類型的事」
新專案踩了新坑	寫進該專案的 CLAUDE.md	萃取到對應的領域腦（所有未來專案受益）
專案 B 比專案 A 先做完	A 不知道 B 的經驗	B 的經驗已在領域腦，A 自動受益
專案數量爆炸	越多越容易漏	領域腦數量固定（技術領域有限）
AI 專家 review	每次從零開始	站在所有歷史經驗之上審查

最關鍵的一行：領域腦的數量不會隨專案數量增長。你可以有 100 個專案，但「iDempiere OSGi」的領域腦就是一份。新經驗加進去，舊經驗不會消失。專案可以刪掉，經驗永遠留著。

閉環：專家 review 終於有意義了

之前（斷裂的）：
  專家 review → 找到問題 → 修進當前專案 → 下個專案又不知道
                                              ↑ 斷在這裡

之後（閉環的）：
  專家 review（讀領域腦 + 當前文件）
       ↓
  找到問題 → 修進當前專案
           → 同時萃取到對應的領域腦
       ↓
  下個專案開始前讀領域腦
       ↓
  專家 review（讀更新過的領域腦 + 當前文件）
       ↓
  ↻ 經驗循環，不斷累積

這才是 AI 專家 review 真正有意義的前提：他們站在所有歷史經驗之上做審查，而不是每次都從零開始。

現實的限制

領域腦不是完美解法。它依然有幾個問題：

萃取是手動的 — 目前沒有工具能自動從 CLAUDE.md 提取教訓並分類到領域腦。我是派 AI agent 讀完所有檔案後人工整理的。
維護需要紀律 — 踩了新坑要記得更新領域腦，不只是寫進專案的 CLAUDE.md。如果忘了這一步，循環又斷了。
領域邊界不總是清楚 — 一個 bug 可能同時涉及 OSGi、2Pack、和 PO Model。要判斷放哪個腦，或者放多份。
Token 成本 — 領域腦加起來約 2000-3000 tokens。每次新對話讀取相關的 2-3 份，約 $0.005-$0.015。每月 $5-15，可以接受。

但即使有這些限制，領域腦依然比「靠人記得哪個專案有哪些經驗」好太多了。因為人的記憶會隨專案數量退化，領域腦不會。

完整解法：Domain Brain 宣告 + fix: 驅動更新

經過不斷推敲，最終方案有三個核心機制：

機制一：每個專案用一行宣告自己需要哪些腦

# 每個專案的 CLAUDE.md 開頭加一行：

idempiere-tw-ai-assistant/CLAUDE.md:
  ## Domain Brain: osgi-bundle, 2pack, po-model, python-llm-integration

analyst/CLAUDE.md:
  ## Domain Brain: python-crawler-data, design-principles

新專案/CLAUDE.md:
  ## Domain Brain: python-crawler-data, design-principles

為什麼不用資料夾名稱比對？因為 analyst/ 裡有爬蟲也有 API 也有 SQLAlchemy——資料夾名稱不等於技術領域。為什麼不用關鍵字比對？因為「API」出現在 iDempiere REST、Groq LLM、爬蟲、自己的 FastAPI 四種 context 裡，關鍵字比對直接崩潰。

讓專案自己宣告是最可靠的——你看得到、可以改、一行字。AI 讀到 CLAUDE.md 就知道要載入哪些腦，不用猜。

機制二：fix: commit 驅動更新

新經驗怎麼回到領域腦？不是靠事後整理，而是靠 fix: commit 當觸發點：

每次 AI 寫出 fix: 開頭的 commit message：
  1. STOP — 不要急著做下一個 task
  2. 問自己：「這個 fix 會不會在其他專案也發生？」
  3. 是 → 當場更新對應的領域腦（不是之後，是現在）
  4. 領域腦更新後，所有未來專案的 review 都能受益

機制三：專家 review 帶著腦

派專家 review 時：
  1. 專家讀該專案的 CLAUDE.md → 看到 Domain Brain 宣告
  2. 專家讀對應的腦 → 帶著所有歷史 bug 經驗
  3. 審查當前文件 → 站在經驗之上，不是從零開始
  4. 找到新問題 → 修完 → 更新腦
  5. 下一個專案的專家 → 拿到更新過的腦
  ↻ 循環

三個機制合在一起的效果

你要做的事	AI 自動做的事
新專案加一行 Domain Brain（6 個字）	讀對應的腦、帶著經驗開始工作
不需要做任何事	fix: commit 時自動判斷是否更新腦
說「派專家審查」	專家帶著最新的腦去審查
偶爾說「把這個更新到腦」	當場更新，所有未來專案受益

還是不完美的地方

你自己 debug 沒跟 AI 說的坑 — AI 不知道，無法更新腦。你得養成習慣說一句「把這個更新到腦」
其他同事的經驗 — 除非他們也更新領域腦，否則知識在他們腦子裡消失
新領域出現 — 7 份腦不夠用了（比如加了 DevOps 或 mobile）→ 建新的腦檔案
AI 判斷 fix: 是否該更新腦 — 還是靠判斷，可能漏。但比「完全沒有機制」好太多

結語

叫再多專家進來 review，如果他們不知道要看歷史紀錄，就跟你請了 20 個新員工來審查、但不給他們看前任的交接文件一樣。當你的專案多到連自己都記不清有哪些，而 AI 又不會主動翻遍你的 42 個資料夾找經驗——這時候你需要的不是更聰明的 AI，而是一個能自動把經驗送到 AI 面前的系統。領域腦不是完美的系統，但它把「靠人記住 42 個專案的經驗」變成「靠 7 份按領域整理的文件」。專案會越來越多，但技術領域是有限的。這就是為什麼領域腦能 scale，而按專案管理經驗不能。

跟 AI 協作的真正技巧不是「讓 AI 更聰明」或「叫更多 agent」，而是設計一個流程，讓正確的經驗在正確的時間被讀取。這聽起來很簡單，但直到你踩了同一個坑兩次，你才會真正理解為什麼需要這麼做。

2026 年 3 月 31 日