Claude Design 的最大價值是什麼？

最大價值是『砍掉不該做的事』。在 brainstorming 階段透過多輪對話，可以在寫到 code 之前就砍掉不必要的功能，節省大量重工成本。實測可以省下 3-4 小時的 coding 時間。

什麼時候不應該用 Claude Design？

當 task 粒度很小時（例如修一個 bug、改一個顏色、加一個小按鈕），跑完整三層流程的 overhead 會大於價值。特別是 subagent-driven-development 對單檔 HTML 原型是殺雞用牛刀，39 次 subagent dispatch 會拖慢整體開發速度 3-5 倍。

brainstorming 跟直接聊需求有什麼差別？

brainstorming 是結構化的一問一答流程，每次只問一個問題、強迫使用者做選擇題或給具體方向。它會逼出使用者心中還沒表達清楚的『設計原則』（例如本次的『可預期』），這些原則通常比功能清單更重要。

Spec 文件裡一定要有表格嗎？

當你有 10 個以上的相似內容（例如 15 個遊戲的 3 條提示、20 個 API 的 error message）時，用表格一次寫完能強制保持風格一致。如果分批生成，AI 的語氣會漂移。表格讓一致性不靠意志力維持，而是靠資料結構強制。

Claude Design 跟傳統 SDD（Spec-Driven Development）有什麼差別？

方法論完全一樣，都是 brainstorming + spec + plan + implement。差別只在「強制力」：Claude Design 把 SDD 步驟變成 Skill，加上 HARD-GATE 禁止跳過設計階段，產物寫到固定路徑。用菜譜做比喻，Claude Design 是把 SDD 從「師傅口授」變成「人人可做」的菜譜。

菜譜化的 SDD 有什麼風險？

最大風險是你照著菜譜做出漂亮的產出，就以為自己會了，但遇到菜譜涵蓋不了的變化就卡住。AI 時代更危險：你再問 AI 會得到另一個菜譜，你永遠繞著菜譜轉卻沒建立基本功。你的能力上限會被 AI 給的菜譜深度封頂——而且你不知道自己不知道。

怎麼補 SDD 的基本功？

每次用 Claude Design 前，自問「如果沒這個菜譜我會怎麼做？」。如果答不出來，就該去讀 SDD 的原理——為什麼要分離設計和實作、為什麼多輪澄清比一次問完好、為什麼修改文字比修改 code 便宜。懂「為什麼」才能在菜譜斷裂處自己接住。

中華一番「大魔術熊貓豆腐」跟 AI 有什麼關係？

這段劇情裡有三個 AI 結構上做不到的元素：(1) 對手把稻草放進黃豆這種社會性干擾，AI brainstorming 不會模擬；(2) 辨識大豆變納豆需要跨文化背景知識在當下湧現，AI 知道但不會主動從邊緣冒出來；(3) 把汙染當靈感起點是 AI 訓練資料裡的反模式——AI 會建議你丟掉重做。這是「小當家路」跟「紹安路」的結構差異。

什麼是「小當家模式」信號詞？

使用者跟 AI 約定的一個切換信號：說「這次要小當家模式」時，AI 應該立刻關閉 Claude Design / brainstorming / spec 等結構化流程建議，不給業界做法，反過來問使用者的個人史、身邊的人、最近讓他困惑的意外事件。目的是強制 AI 跳出統計意義上的最佳解，幫使用者挖掘只有他個人脈絡才有的 insight。

對抗菜譜化最關鍵的一件事是什麼？

保留一塊「AI 絕不介入」的創作領域。不是少用 AI，是完全禁止——照顧長輩的手寫日記、一個嗜好、每週一天完全不開 AI。這塊領地是維持「能產生小當家型靈感」的保護區。沒有這塊禁區，其他所有對抗菜譜化的做法遲早會被 AI 侵蝕回去。

Claude 4.7 的 cross-session memory 是全新的機制嗎？

不是。Session 之間仍然完全隔離，模型本身沒有任何跨 session state。所謂 cross-session 是 Claude Code 在新 session 開啟時自動注入 CLAUDE.md、MEMORY.md 等檔案。4.7 改進的是模型對這套檔案機制的使用熟練度，不是機制本身。

自建 Brain 系統和 Claude 原生 auto-memory 有什麼差別？

本質機制相同（都是檔案加 CLAUDE.md 橋接），但 Brain 是跨專案、手動 curate、按 domain 分類、搭配 Skill 配對使用；auto-memory 是單專案、自動維護、較易累積雜訊。Brain 等於精煉版 cross-session memory。

Named sub-agent 和 Team A/B/C 衝突嗎？

不衝突，它們是互補的兩個層次。Team A/B/C 解決多工平行（宏觀），Named sub-agent 解決單工多輪延續（微觀）。最佳做法是同時使用：宏觀 Team 隔離不同主題，微觀 Named agent 讓每個 teammate 跨輪次保留記憶。

為什麼 bug 追查要用 PUA 加上 Named agent？

PUA 是方法論（怎麼思考 — 逼自己窮盡替代假設），Named agent 是容器（怎麼記住 — 跨輪次保留歷史）。單用 PUA 每輪要重講 context 且可能重複走錯路；單用 Named agent 記得歷史但可能停在第一個假設。兩者組合才是真正的 bug hunter。

在沒有 PUA skill 的機器上要怎麼辦？

把 PUA 的核心精神內嵌到 brain 檔成為 inline fallback，例如假設第一個假設是錯的、修好了要問為什麼以前會壞、真正的 root cause 能解釋所有觀察。Skill 優先使用（維護中、品質更新快），brain 兜底（確保沒 skill 的機器也能運作）。

AI Agent Team 應該開幾個 agent?

Agent 數量應該是 staffing 過程的輸出,不是輸入。正確的流程是:先枚舉計畫需要哪些視角(使用者/PM/測試/各種技術視角),每個視角用「風險 × 範圍」打 0-9 分,高分獨立成 agent、低分 fold 到其他 agent 的 prompt,最後檢查記憶體預算(16GB 機器可用 ~11GB)。數量是最後才算出來的結果,不是一開始的限制。

16GB 機器上最多可以跑幾個 Agent?

不是數量上限,是記憶體預算上限。16GB 扣掉系統和 Docker 後可用約 11GB。全 Opus 情境下約 3 個(每個 ~1GB),混合模型可以擴展到 8+ 個(opus ~1GB、sonnet ~0.6GB、haiku ~0.4GB)。例如 1 Opus + 5 Sonnet + 2 Haiku = 4.8GB,8 個 agent,仍在預算內。

純 Python 專案需要使用者、PM、測試者視角嗎?

需要。使用者、PM、測試者是三個永遠不能省的視角,即使是純技術、只有 Python、只有你一個人的專案。這三個視角可以 fold 到其他 agent 的 prompt(例如讓 implementer 在設計階段戴 PM 帽子),但絕對不能默默省略。省略會產出「技術上正確、實用上無用」的東西。

小任務(例如 3 行 API)需要專職的 agent 嗎?

小任務通常不需要專職 agent,但需要資深視角。反直覺的是:實作越簡單,越該派資深思考,而不是 junior implementer。原因是小任務的實作風險很低,真正的風險已經轉移到「該不該存在」(架構師視角)、「會不會在奇怪情境下爆」(測試者視角)、「運維怎麼用這個做決策」(運維視角)。3 行 /health endpoint 應該派 1 個 Sonnet,但 prompt 優先順序是運維 > 架構 > 測試 > 實作。

角色和視角有什麼不同?

角色(頭銜)是固定清單(backend-dev、frontend-dev、QA...),視角(perspective)是「怎麼思考這件事」的觀點。頭銜思維從「我有幾個 slot」出發,視角思維從「這個計畫需要哪些思考」出發。頭銜思維下小專案會省略視角(「只有 Python 不需要 PM」),視角思維下視角數量由計畫決定,只是可能 fold 到同一個 agent 身上。兩者的關鍵差別是:視角思維保證每個必要思考都發生,頭銜思維只保證每個頭銜都有人。

Agent Team 規則為什麼會自我強化成壞規則?

透過 template anchoring。一次事故產生一條保守規則,這條規則反映到 template 的例子上,template 的例子成為你初始化新專案的「低錨」,每次用 template 都會產出符合低錨的設計,低錨的設計變成「標準」,標準反過來強化原規則。打破這個循環必須同時改規則和 template,不然新專案會繼承舊錨,規則永遠修不乾淨。

作者: tm731531

Hacker News 每日精選 – 2026-04-21
“`html

科技趨勢日報

🚀 科技趨勢日報：從 Apple 領導層更迭到 AI 驅動的系統風險

今日科技圈迎來了重大的領導層變動，Apple 預計將進行關鍵的 CEO 交接，這將影響未來數年的生態策略。同時，AI 技術正從單純的對話工具，轉向影響基礎設施穩定性與社會公平性的深層領域，這些趨勢值得每一位技術從業者密切關注。💡

🤖 AI / 機器學習

Qwen3.6-Max-Preview: 更聰明、更敏銳、持續進化

阿里巴巴推出的最新 Qwen3.6-Max-Preview 模型展示了強大的推理能力。該模型在處理複雜任務時表現得更加精準，且開發進程非常迅速。對於尋求高性能開源模型的開發者來說，這是一個不容忽視的選擇。
- 原文連結： 查看原文
Anthropic 重新開放 OpenClaw 風格的 Claude CLI 使用權限

Anthropic 針對開發者社群傳回的好消息：現在再次允許 OpenClaw 風格的 Claude CLI 使用方式。這對於依賴命令列介面進行 AI 自動化開發的工程師來說，極大提升了工作流的靈活性。這次政策的放寬顯示出 AI 公司在開發者工具生態上的策略調整。
- 原文連結： 查看原文
Mediator.ai：利用納許均衡與 LLM 系統化公平性

這是一個非常有創意的專案，嘗試將博弈論中的「納許均衡」（Nash bargaining）與大型語言模型結合。其目標是透過數學模型與 AI 的判斷力，在複雜的決策過程中建立一套系統化的公平機制。這為 AI 如何介入社會決策提供了一個全新的研究視角。
- 原文連結： 查看原文
🛠️ 開發工具

一個 Roblox 惡意程式與 AI 工具竟然搞垮了 Vercel 平台

這是一篇令人警醒的案例分析，探討了 Vercel 平台如何遭遇大規模停機。令人驚訝的是，引發災難的原因竟是一個針對 Roblox 的作弊工具與某個 AI 工具的奇異組合。這凸顯了現代雲端基礎設施在面對非典型流量與複合型攻擊時的脆弱性。
- 原文連結： 查看原文
如何製作一個快速的動態語言解釋器

對於底層開發愛好者來說，這是一篇深度技術文章。作者詳細剖析了在實現動態語言解釋器時，如何透過各種優化手段提升執行效率。這對於想要深入理解程式語言執行機制的人來說，是極佳的學習教材。
- 原文連結： 查看原文
Jujutsu 的大規模合併（Megamerges）實驗

討論關於 Jujutsu 這個版本控制工具的使用心得。作者分享了如何透過「大規模合併」功能來提升開發效率並增加趣味性。對於正在尋求 Git 以外替代方案的開發者來說，這提供了有趣的參考。
- 原文連結： 查看原文
💼 創業 / 商業

John Ternus 即將接任 Apple CEO

Apple 宣布了一項重大的領導層佈局：Tim Cook 將轉任執行主席，而 John Ternus 將正式接任 CEO。這標誌著 Apple 正進入新的領導時代，這名技術背景深厚的領導者可能會為硬體與軟體的深度整合帶來新的變革。這對整個科技產業的供應鏈與產品路徑圖都將產生深遠影響。
- 原文連結： 查看原文
🌐 其他

海底電纜是如何維修的？

這是一篇科普性質極佳的文章，介紹了維護全球網路命脈——海底電纜的艱辛過程。從深海定位到複雜的修復技術，讀者可以了解到支撐現代數位世界的物理基礎是如何運作的。
- 原文連結： 查看原文
盆栽風格之美

在硬核技術之外，這篇文章帶領讀者進入寧靜的盆栽藝術世界。探討不同盆栽風格背後的哲學與美學，適合在繁忙的工作之餘放鬆心情。
- 原文連結： 查看原文
d100 發明者 Louis Zocchi 逝世

桌遊與角色扮演遊戲界的一位重要人物逝世。Louis Zocchi 作為 d100（百面骰）的發明者，對遊戲設計的數學化與多樣性做出了重要貢獻。
- 原文連結： 查看原文
💡 今日觀點

核心趨勢總結： 今日的資訊顯示出兩個明顯的趨勢——第一，AI 正從「單點工具」轉向「系統組件」，無論是從模型性能的提升，還是它對基礎設施穩定性帶來的意外挑戰；第二，科技巨頭正在進行結構性的戰略轉移，Apple 的領導層更迭正是這種長期佈局的縮影。

給讀者的行動建議：
1. 關注 AI 穩定性： 如果你在維運雲端環境，請開始思考 AI 自動化工具可能帶來的非預期連鎖反應，並加強異常監控。
2. 跟進開源模型： Qwen 等開源模型的快速迭代意味著開發者不再受限於單一供應商，建議嘗試將最新的開源模型整合進你的工作流中。

“`
2026 年 4 月 21 日

Claude Design 實戰拆解：brainstorming/spec/plan 三層流程的必要性與代價

重點摘要

Claude Design 不是一個工具，是 Claude Code 裡由 brainstorming → writing-plans → subagent-driven-development 三個技能組成的結構化開發流程，把「想 → 寫規格 → 拆任務 → 做 → 審查」變成可追蹤的步驟。
最大價值是「砍掉不該做的事」——在我的失智症陪伴專案裡，這個流程幫我在寫 code 前砍掉了背景音樂、獨立話題卡、每日心情打卡三個功能，省下至少 3-4 小時重工。
設計原則會在對話中浮出來——使用者一句「照顧者腦子清晰的，可以有期待的方式知道」變成整個系統的「可預期」原則，驅動 45 條提示語都用同一個模板。
但它不適合所有情境——單檔 HTML 原型用 subagent-driven-development 會被 39 次 subagent dispatch 拖到超慢，實測比 inline 慢 3-5 倍。
判斷標準：想事情時用 brainstorming、寫一致內容時用 spec、多檔複雜時用 subagent；單檔改一個函式就直接 inline。
最深的反省：Claude Design 其實就是把 SDD「菜譜化」。人人可以照做，但如果不懂菜譜背後的「為什麼」，遇到菜譜涵蓋不了的變化就卡住。AI 時代最危險的是「永遠繞著菜譜轉、卻以為自己會了」——你的能力上限會被 AI 給的菜譜深度封頂。
用中華一番「大魔術熊貓豆腐」案例說明：對手下黑手、大豆意外變納豆、把汙染當靈感——這三個 AI 結構上做不到的元素。文末附 7 個對抗菜譜化的具體做法，最關鍵是「保留一塊 AI 絕不介入的創作領域」。

「Claude Design」這個名字其實沒有官方定義，它是 Claude Code 裡一組設計驅動的工作流程技能（superpowers:brainstorming / writing-plans / subagent-driven-development）的總和。我最近用它做了一個失智症陪伴 APP 的重大功能迭代，這篇文章把它在實戰中「什麼時候救了我」跟「什麼時候反而拖慢我」完整拆給你看。

Claude Design 是什麼？三層流程一次看懂

Claude Design 是一套讓 AI 助手在動手寫 code 前先「想清楚 → 寫規格 → 拆任務」的結構化流程。它不是任何新工具，而是 Claude Code 內建的三個技能組合使用：

階段	技能名稱	產出	目的
1. 發想	`brainstorming`	設計 spec（Markdown）	用多輪一問一答釐清需求、砍掉不該做的、浮出設計原則
2. 規劃	`writing-plans`	實作計畫（含驗證步驟）	把 spec 拆成 10-20 個可個別 commit 的小任務
3. 執行	`subagent-driven-development`	每個 task 一個 commit	派 subagent 做、派 subagent 審 spec、派 subagent 審 code quality

重點不是「三個步驟」這個形式本身，而是每一步強迫你跟 AI 在不同粒度上達成共識：brainstorming 達成「做什麼」、spec 達成「做成什麼樣」、plan 達成「怎麼拆」、subagent 執行時還能雙重審查。

沒用 Claude Design vs 用 Claude Design 的實際差異

同樣是「加一個照顧者支援功能」的需求，兩種做法的差別在哪？這是我實測後的對照：

面向	直接叫 AI 寫	走 Claude Design 流程
需求釐清	憑 AI 猜，常常做錯方向	多輪問答，需求明確後才動手
功能範圍	容易做太多（AI 傾向加功能）	在 brainstorming 階段就砍掉不必要項目
一致性	做到一半風格會漂移	spec 用表格固定內容模板
可追蹤	一個大 commit 或多個散亂 commit	每 task 一個 commit，可個別 revert
重工成本	常常寫完才發現方向錯	方向錯在 spec 階段就發現
速度	單點快、整體容易重工	前期慢、後期穩；不適合微任務

實戰案例一：砍功能，省下 3-4 小時重工

Claude Design 最值錢的貢獻不是寫 code，是阻止你寫不該寫的 code。在我的失智症陪伴 APP 迭代過程中，brainstorming 流程實際上幫我砍掉了三個功能：

砍掉案例 1：背景音樂

我一開始提議加背景音樂（失智症音樂療法有根據），brainstorming 過程中討論到「單檔 HTML 沒辦法帶 MP3、base64 嵌入會讓檔案爆到 30MB、用 File API 每次要重選」三個技術方案的取捨後，使用者自己說「先不要」。如果沒經過討論直接開寫，我大概會先做 File API + ducking 邏輯寫個兩小時，結果做完發現整個方向不對。

砍掉案例 2：獨立話題卡

原本規劃「話題卡」+「遊戲中陪伴提示」是兩個獨立功能。討論到一半，使用者界定：「這個 APP 是玩樂的時候用，真的要純聊天另外開 APP」。這句話直接把「獨立話題卡」功能從 spec 刪除，只保留遊戲情境下的提示。沒有這個界定，我會把話題卡塞進首頁，未來做下一個 APP 會有功能衝突。

砍掉案例 3：每日心情打卡

我在 brainstorming 時列過 5 個功能候選，其中「每日狀態簡記」（3 秒打卡心情/精神/食慾）看起來很有價值。使用者沒選這個，理由是「會把 v2 從『打開就用』變成『每天要記得打卡』，失智照顧者已經很累了」——這是使用者比我更懂他的使用情境的典型例子。AI 單獨設計是想不到這層的。

這三個砍掉的功能合計估計省了 3-4 小時的 coding + 之後的 code review + git 回改。這才是 Claude Design 最值錢的部分——它讓「沒寫到 code 就砍掉」變成可能。

實戰案例二：「可預期」這個原則如何救了 45 條提示語

brainstorming 過程中，使用者往往會不經意說出一句話，變成整個系統的設計支柱。這次是這一句：

「我希望對於照顧者而言，他是腦子清晰的，他可以有期待的方式知道，我可以看到該說什麼。」

這句話裡面的「可預期」被提煉成整個功能的設計原則，寫進了 spec。然後這個原則驅動了三個具體決策：

提示固定模板：15 個遊戲 × 3 個時機（開場/答對/完成）= 45 條提示，全部用「情境 → 可以直接說的話」這個同一個格式，照顧者看一次就學會。
摘要強制預覽：不是一按就複製，而是開 modal 預覽、確認內容，才複製。照顧者對輸出「可預期」。
按鈕只在完成活動後才出現：有資料才有按鈕，避免使用者按下去才發現「沒東西可傳」。

沒有 brainstorming 把這個原則浮出來、沒有 spec 把它寫下來，我會寫 45 條有個性的不同句型（AI 本能會追求多樣性）。結果照顧者每次要重新解讀 UI，反而更累。「可預期」這個字沒有出現在原始需求，是對話中自然生成的，但它比任何功能清單更重要。

實戰案例三：Spec 表格讓語氣不漂移

Spec 文件裡有一張表格，把 15 個遊戲 × 3 個時機 × 實際內容全部列出來：

遊戲	開場	答對時	完成時
顏色辨識	哇，好多顏色，你以前最愛穿什麼顏色？	對！你好厲害	今天陪你看顏色，我也覺得很漂亮
認字遊戲	這個字你以前就認得吧	對啦，這個字你小時候就會了	今天還認這麼多字，真棒
呼吸練習	我們一起慢慢呼吸	（改成中段顯示）吸氣…吐氣…不急	輕輕摸摸他的手，這樣就好

如果不是在 spec 階段一次寫完這張表，而是「做到顏色遊戲時寫顏色的 3 條 → 做到形狀遊戲時寫形狀的 3 條」這樣推進，語氣一定會漂移。寫到第 10 個遊戲的時候我會忘記前面的語氣，變成有些句子很溫暖、有些很乾。表格逼我一次寫完，才有辦法保持「你年輕時、你很厲害」這類一致的溫度。

這是表格化內容的威力——它讓「一致性」不是靠意志力維持，而是靠資料結構強制。

反例：Claude Design 不適合的時候

這次實戰也讓我踩到一個很明顯的坑：subagent-driven-development 對單檔 HTML 原型是殺雞用牛刀。

我一開始對 13 個 task 全部套用標準流程：每個 task 派 1 個 implementer subagent + 1 個 spec reviewer + 1 個 code reviewer，總共 39 次 subagent dispatch，每次 20-130 秒。前幾個 task 都只是「加一個 const、改一個函式」這種改動，triple review 完全是過殺。

使用者實測後直接問我：「你寫程式變慢很多你用什麼模型」——這是一個誠實的信號。我當下檢討並切換到 inline 執行模式（我自己在 session 裡直接做），後半段 8 個 task 的速度回到正常的 3-5 倍。

這個教訓很值：流程的 overhead 必須跟 task 粒度匹配。如果你的 task 只是改 20 行 code、不會影響其他模組，triple review 沒有價值，還會讓每個 task 多花 3-5 分鐘在 subagent 啟動/總結上。

更重要的反省：Claude Design 是「菜譜」，不是基本功

讀到這裡，你可能會問：「Claude Design 其實不就是 Spec-Driven Development（SDD）嗎？」 沒錯。brainstorming + spec + plan + implement 這四步是 SDD 老方法，不是 Claude Code 發明的。Claude Design 做的事其實是把 SDD 從「一千個人有一千種做法」方法化成「人人可以順暢工具化」的標準流程。

這是好事，也是很危險的事。

菜譜出現前、出現後

想像一下麻婆豆腐這道菜：

菜譜出現前：只有師傅會做。每個師傅的麻婆豆腐都不一樣，因為他們從「為什麼要用豆瓣醬、為什麼花椒要後下」這種基本功思考過。客人要求「少辣多麻、加竹筍」這種變化，師傅能即時調整。
菜譜出現後：人人可以照做，麻婆豆腐變得普及。但只會照菜譜的人，遇到「客人對豆瓣醬過敏，要用別的替代」這種問題就卡住了——因為他從來沒問過「為什麼要用豆瓣醬」。

Claude Design 就是出現了菜譜。它把 SDD 的步驟變成 Skill、把「設計審批」變成 <HARD-GATE>、把 subagent 審查變成標準流程。你不需要知道為什麼要分離「設計」和「實作」，照著 skill 走就有規範的輸出。

為什麼 AI 時代這件事特別危險

菜譜時代的廚師，至少還能從菜譜回推原理——多做幾次就知道花椒晚下是為了香氣不揮發。但 AI 時代：

你問 AI「怎麼做需求分析」→ AI 給你 Claude Design 流程
你照流程做，產出看起來很漂亮的 spec 和 plan
你以為你會做需求分析了
遇到「這個需求太模糊、brainstorming 走 10 輪還是卡住」這種菜譜沒涵蓋的情況
你再問 AI → AI 給你另一個菜譜
你永遠繞著菜譜轉，沒有真的建立「為什麼需求會模糊、要怎麼引出使用者的隱藏前提」這種基本功

最可怕的結果：你的能力上限永遠等於 AI 提供的菜譜深度。菜譜涵蓋不了的變化，你就做不到。而且因為你沒痛過傳統 SDD 的坑，你連「現在這個情境是菜譜解不了的」都判斷不出來——你不知道自己不知道。

SDD 真正的基本功是什麼

Claude Design 的 skill 不會教你這些，但這些才是真正讓你能判斷、變通、甚至挑戰流程的基本功：

菜譜只教你「做什麼」	基本功讓你懂「為什麼」
brainstorming 要一次問一個問題	人的認知頻寬有限，多問題並排會讓使用者選擇癱瘓而隨便回答
spec 要寫 45 條提示的表格	分批生成會有語氣漂移，但為什麼會漂移？因為 LLM 每次 context 都重新「感覺」一次
實作前要設計審批	因為修改 code 的成本遠高於修改文字，越晚發現方向錯越貴
subagent 要 triple review	多視角審查降低單一 agent 的盲點，但前提是 task 複雜到值得這個 overhead
每 task 一個 commit	Git bisect 的粒度等於 debug 速度，太粗的 commit 追 bug 要多花 10 倍時間

懂了「為什麼」，你才能在菜譜斷裂的地方自己接住。例如：brainstorming 走不下去，你會知道這是因為使用者自己也沒想清楚，你要換一個方式（給他看 mockup 而不是繼續問字）而不是換另一個菜譜。

給讀者的反省題

每次用 Claude Design 之前，自問一句：「如果沒有這個菜譜，我會怎麼做這件事？」

如果你答得出來 → 你用 Claude Design 是省時間
如果你答不出來 → 你該先花時間讀 SDD 的原理，而不是依賴 skill 的自動化

這不是反對 Claude Design。菜譜是好事，讓一道菜普及化。我想提醒的是：Claude Design 方便到你可能永遠不會問「為什麼」。而一個工程師的上限，取決於他問過多少個「為什麼」。

什麼時候用、什麼時候跳過？判斷決策表

情境	建議流程	理由
有多個可能方向、還在猶豫	brainstorming	避免選錯方向重工
要改 15+ 個相似位置、要寫一致的內容	brainstorming + spec	用表格強制一致性
多檔複雜後端、有 test framework、多人協作	完整三層 + subagent	triple review 能防止衝突跟回歸 bug
單檔 HTML、改一個函式、加一個按鈕	直接 inline，跳過流程	overhead 大於價值
修 bug 已經知道怎麼修	直接改，不派流程	問題明確時流程是拖累
重構一個模組的架構	brainstorming + spec（可能跳過 subagent）	要想清楚新架構但執行可以快

3 個給讀者的實作建議

開工前先問自己一句話：「這個 task 的粒度適不適合走流程？」如果是「修一個 bug」「改一個顏色」，直接做；如果是「加一個新功能」「重構一個模組」，走 brainstorming。
brainstorming 時刻意引導 AI 砍東西，不是加東西。AI 本能傾向加功能，你要主動問「這個是不是另一個 APP 的事？」「這個能不能先不要做？」。砍掉的功能是最值錢的產出。
Spec 一定要用表格呈現重複性內容。如果你有 10+ 個相似的東西（15 個遊戲的 3 條提示、20 個 API 端點的 error message、12 個表單欄位的 placeholder），強制用表格一次寫完，不要分批生成。

中華一番案例：AI 結構上做不到的創新

講到這裡都還是抽象論述。讓我用一個具體案例把「AI 為什麼結構上做不到某些創新」講清楚——1997 年日本動畫《中華一番》第 43 集「大魔術熊貓豆腐」。

劇情背景：小當家與黑暗料理界的邵安，在樓麟艦上進行豆腐對決。評委要求不能用現成豆腐，必須從黃豆開始做。比賽中：

對手下黑手：黑暗料理界的向恩把稻草偷偷放進小當家的大豆裡
意外發生：稻草上的納豆菌讓大豆發酵，大豆變成了納豆（日本傳統發酵食品）
認知翻轉：小當家看到黏糊牽絲的納豆，不是當成「比賽被破壞」丟掉，而是把這個意外當成靈感起點
創新誕生：從納豆的特性衍生出做法與工具，最終做出「大魔術熊貓麻婆豆腐」擊敗邵安

（資料來源：萌娘百科納豆條目，ACGN 中的納豆相關劇情段落）

這故事裡有三個 AI 結構上做不到的元素

劇情元素	AI 為什麼做不到
對手下黑手破壞材料	AI 的 brainstorming 永遠假設「正常情境」，不會模擬「比賽中有人陷害你」這種社會性干擾
辨識大豆已變納豆	需要跨文化背景知識在當下湧現。一個四川廚師要有人把日本發酵食品的視角帶進來，AI 知道但不會主動從「邊緣」冒出來
把失敗當靈感起點	AI 被訓練避免失敗、給成功解。被汙染的食材應該丟掉重做——這是 AI 的強勢模式。把 contamination 翻轉成創新起點是訓練資料裡的反模式

我把這個對比叫做「紹安路 vs 小當家路」：

紹安路：精修技術、重組既有元素、走正統菜譜 → AI 擅長
小當家路：個人記憶 + 意外事件 + 跨文化知識 + 重新定義失敗 → AI 做不到

紹安在豆腐三重奏對決中輸得更深：他自以為原創的料理，其實 7 年前師父陳邦鈴就做過一樣的。他切斷了有意識的傳承，但無意識的傳承切不斷——他走遍中國、投奔黑暗料理界研發的「自創」菜，結構上還是師承的重組。

用 Claude Design 久了的人可能遇到比紹安更慘的處境：紹安至少還是在複刻真實的師父，你在複刻 AI 訓練資料——但你不會知道，因為沒人會告訴你「這個東西 AI 在 2023 年就生成過一模一樣的了」。

7 個對抗紹安化的具體做法（可以從下個 task 開始）

如果你接受「菜譜化是現實、不會回頭」這個前提，那問題就不是「要不要用 Claude Design」，而是「怎麼用但不被它吃掉」。以下是我經過這次專案後整理的 7 個具體做法：

1. 先離線想 10 分鐘，再開 AI

用紙筆或純文字檔，在沒有 AI 的狀態下先寫下你對這題的想法——即使亂七八糟、半句話、只有關鍵字。寫完才來找 AI。這 10 分鐘的差別，是你有沒有在對話開始前建立自己的立場。

2. 刻意加入 AI 絕對不會建議的約束

AI 傾向推薦「平均來說最好的解」。你主動加怪條件逼自己走不一樣的路。例：做失智症陪伴工具時，不要說「做陪伴 APP」，說「做一個只能給老花眼、色盲、聽障照護者用的工具」——限制是創新的助產士。

3. 每週跟一個「四郎」講一次話

不是讓他們給你解決方案，是把他們的「意外知識」放進你生活。失智照護協會的阿姨、你媽或阿嬤（上一代的照護記憶）、會日文的朋友、幼稚園老師（他們跟認知差異的小孩互動方式跟失智照顧很像）⋯⋯讓他們隨口說的話在你腦裡發酵，像稻草丟進黃豆。

4. 把「bug / 意外 / 失敗」當創作材料，不是要避免的事

開一個 inspirations-from-failures.md，每次遇到意外事件，先不要問怎麼解，先寫三句話：這個意外讓我看到什麼我原本沒看到的？這個限制如果我接受它，會變成什麼新東西？如果我把這個「bug」當成功能，會是什麼？AI 的訓練資料裡「bug 要修」是強勢模式，你要刻意反抗這個傾向。

5. 對 AI 使用「反向問法」

每次 AI 給你答案，下一句問：「這答案的相反是什麼？」「80 歲阿嬤會怎麼想這件事？」「如果這是錯的，錯在哪？」「這答案看起來合理，可是我錯過了什麼？」——這會強迫 AI 跳出訓練資料的中心，去邊緣抓東西。AI 不會主動做這件事，你得逼它。

6. 保留一塊「AI 絕不介入」的創作領域

不是「少用 AI」，是完全禁止。具體例子：照顧長輩的手寫日記（絕不給任何 AI 看）、一個嗜好（煮菜、種花、學樂器）、每週一天完全不開 Claude / ChatGPT。這塊領地是你保持「能產生小當家型靈感」的保護區。失去這塊，你永遠只能是紹安。

7. 跟 AI 約定「小當家模式」信號詞

當你要創新、不要優化時，直接跟 AI 說：「這次我要小當家模式，不要 Claude Design」。你的 AI 應該立刻做三件事：關閉所有 brainstorming/spec/plan 流程建議、不給業界做法、反過來問你的個人史跟身邊的人。這是你跟 AI 之間的信號詞。沒有它，AI 會把菜譜當成預設。

優先順序：如果只能選一個開始

選第 6（AI 禁區）。沒有這個，其他六個遲早會被 Claude 侵蝕回去。禁區是你維持「小當家能力」的物理基礎。

結論：不是流程多就好，是流程跟 task 匹配才好

Claude Design 不是一個「你該永遠用」的聖杯，也不是一個「多此一舉」的噱頭。它是一套當你面對真正需要思考的問題時，把你跟 AI 之間的對話規則化的工具。

我這次失智症陪伴 APP 專案裡，Claude Design 救了我的前半段（brainstorming 砍功能 + spec 寫一致的 45 條提示），拖慢了我的後半段（subagent-driven-development 對單檔 HTML 過殺）。能分清這條線，是下次用它用得更好的關鍵。

如果你的下一個 task 真的很簡單、你已經知道怎麼做——直接做。但如果你正在「想不清楚這功能該不該做」或「要做 15 個相似的東西怕語氣不一致」，那就值得花 20 分鐘先走 brainstorming。這 20 分鐘會幫你省下 3-4 小時。

Claude 4.7 Memory 與 Agent Team 實戰：自建 Brain 系統的真正價值

重點摘要

Claude 4.7 的 memory 改進本質是「檔案使用得更好」，不是新增神奇的跨 session 記憶機制 — session 之間仍然完全隔離，靠 MEMORY.md 等檔案橋接。
自建 Brain 系統 = 精煉版 cross-session memory：機制相同（檔案 + CLAUDE.md 宣告載入），差別在手動 curate、domain 分類、顯式載入，品質遠勝 auto-memory。
Named sub-agent 真正的價值在「單一任務多輪延續」，不是 Team A/B/C 那種多工並行 — 兩者是互補的兩個層次。
Bug 追查 = PUA 方法論 × Named agent 容器 × Brain 更新，三層缺一不可，且要對「無法中斷的頻道（如 Bot）」具備韌性。
模型版本升級 ≠ 知識管理升級：Brain 系統是 model-agnostic 設計，換任何 LLM 都能搬過去。

Anthropic 在 2026 年 4 月發布的 Claude Opus 4.7 在 memory 和 Agent Team 兩塊都有顯著改進。但這些「改進」對已經自建知識架構的開發者來說，究竟是關鍵升級還是錦上添花？本文整理一天的深度討論，對比 Claude 原生機制和自建 Brain 系統，並落地一套可跨機器攜帶的 bug 追查框架。

Part 1：Memory 系統 — 4.7 改了什麼，對我有什麼用

Claude 4.7 的三個 memory 改進

Claude Opus 4.7 在 memory 方面的改進可以拆成三個層次：

檔案式 memory 變「一等公民」：4.7 特別訓練用檔案系統當 memory（scratchpad、notes、structured store），能主動寫筆記且下次對話時知道去讀筆記。
Cross-session 穩定性提升：跨多 session、多小時的工作流程一致性更好，模型會依 brain 和 memory 的指引從上次停下的地方接續。
1M context 無長 context 溢價：原生百萬 token context window，不另收費。以前 200K+ 要 /compact 的場景現在一口氣吃完。

Cross-session memory 的真相：沒有魔法，只有檔案

很多人以為 Claude 4.7 的 cross-session memory 是某種「核心系統」幫你串起過去對話。真相是：session 之間仍然完全隔離，模型本身沒有跨 session 的任何 state。所謂 cross-session，是 Claude Code 在新 session 開啟時自動注入：

CLAUDE.md（你寫的指令）
MEMORY.md 和 topic files（auto-memory 累積的筆記）
過往 session summary（Claude Code 自動寫的摘要檔）

這些全是檔案，不是隱藏的 cloud memory。4.7 改進的不是機制，而是對這套檔案機制的使用熟練度：知道什麼該寫、該去哪讀、讀到後如何套用。

自建 Brain 系統 vs Claude 原生 auto-memory

如果你已經有自建的 Brain 系統（跨專案的技術 domain 知識庫），對比 Claude 原生 auto-memory 會發現：本質是相同機制，差別在淬煉程度。

面向	Claude 原生 auto-memory	自建 Brain 系統
範圍	單專案（綁 cwd）	跨專案（按技術 domain 分類）
載入時機	Claude Code 自動注入	CLAUDE.md 宣告 `Domain Brain:` 主動載入
curation	模型自動（容易塞流水帳）	手動規則過濾（`Why / How to apply` 格式）
外部知識	僅記錄當前對話	支援 `[source: external]` 納入社群/文章的坑
配套	memory 單打獨鬥	Brain + Skill 配對（坑 vs 對的做法）

4.7 對自建 Brain 的實際收益

對已經有成熟 Brain 系統的開發者，Claude 4.7 的 memory 改進主要體現在兩個地方：

Context 吞更多（70% 的價值）：1M context 可以同時載入所有相關 brain + CLAUDE.md + 當前 code，不再被切斷。多個 brain 同時載入 5000+ 行也不爆。
維護判斷力（30% 的價值）：叫 Claude 整理 memory 時，4.7 會主動去讀 brain 檢查重複、按規則格式寫，而不是無腦 append。4.6 可能直接塞、不去重。
自動 cross-session 對自建系統無感：已經有 Brain + CLAUDE.md 宣告機制的用戶根本不依賴 auto cross-session，品質比自動版高。

關鍵洞察：模型版本升級 ≠ 知識管理升級。Anthropic 再怎麼升級內建 memory，都在解決「模型如何維護筆記」。但「什麼知識該存、怎麼結構化、跨專案怎麼轉移」是架構設計問題，不是模型能力問題。

Part 2：Agent Team — Named sub-agent 真正解決什麼

4.7 的四個 Agent Team 改進

Named sub-agents：spawn 時給名字，後續用 SendMessage({to: name}) 續接，不用重跑 context
Permission 繼承修正：user-level permissions 現在會正確傳給 teammate，不再每個 teammate 都跳一堆授權 prompt
個別 teammate 可調 mode：spawn 後可以用 Shift+Tab 單獨切換某個 teammate 的 permission mode
/team-onboarding：自動分析使用歷史產生 ONBOARDING.md，幫新隊友快速上手

前置條件：要啟用 CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1，否則 SendMessage 工具根本不存在。

Named sub-agent 和 Team A/B/C 的差異

很多人以為 named sub-agent 是在取代自組 Team 的做法，其實兩者是不同層次的機制，互補而非競爭。

面向	Team A/B/C（宏觀）	Named sub-agent（微觀）
解決什麼	多工平行	單工延續
邊界	不同 task 之間	同 team 內部 agent 之間
Context 燒法	每個 team 獨立燒一份	同 agent 只燒一次，後續增量
適用場景	早上開 3 件不相干的事	追一條長 bug / 深入一個模組

最佳組合是兩者混用：宏觀 Team 隔離不同主題，微觀 named agent 讓每個 teammate 有連續記憶。等於開三家公司並行做不同案子，每家公司裡的同一個員工連續給你服務，不是每次都新人上場。

已知限制：teammate 之間不能互喊

目前 Claude Code 有個已知 bug（GitHub issue #48160）：subagent 本身不能 originate SendMessage。意思是 teammate A 想主動找 teammate B 協作做不到，所有通訊必須經過 team lead 路由，變成星形拓撲（hub-and-spoke）而非 mesh。

另外 delegate mode 有個連帶效應：lead 切到 delegate mode 後，它的權限限制會傳給 teammate，導致 teammate 也不能讀檔、跑命令，整個 team 卡住。解法是 spawn teammate 時明確放寬權限。

Part 3：實戰落地 — Bug 追查框架

為什麼開發和修正要用不同的 agent 拓撲

對話中得到一個清晰的洞察：「開發」和「修正」性質不同，應該用不同的 agent 拓撲。

Case	啟動策略
開發（新 feature）	Team A/B/C 並行，短 context agent，各管一塊
修正（bug / fix）	單一 named agent + PUA，多輪深挖
重構（無新功能）	單一 named agent，多檔追蹤 side effect

認真追 bug 的 agent 應該有的樣子

一個 bug 不是「修好就算了」。它有根本原因（root cause）、爆炸半徑（blast radius）、和教訓（lesson）。停在第一個看似合理的修補是 bug 改頭換面回來的最快路徑。認真的 bug-hunting agent 應該有三層結構：

方法論（如何思考）：PUA 式修辭壓力 — 從不接受第一個假設、永遠挑戰自己的推理、窮盡所有替代方案。
延續性（如何記住）：Named 長壽 agent 跨輪次攜帶 context，不要每輪重新 spawn 新 agent 失去歷史。
事後教訓（如何教未來）：每個修好的 bug 都要更新 brain，否則知識死在這個專案。

三層缺一不可：沒方法論 → 停在第一個合理原因、出 bandaid；沒延續性 → 每輪重講 context、走回原路；沒事後教訓 → 同一個 bug 六個月後在別專案又出現。

頻道韌性：為什麼要假設「無法中斷」

有些 channel（Bot wrapper、API-based tools、async chat）無法真正中斷正在跑的 turn，用戶的輸入只能排進下一輪。框架設計時要把這當前提：

每個 hunter 步驟要快速 return 控制權，不要 chain 10 個 tool call
長任務用 run_in_background: true 讓 lead 儘快 ready
在自然 checkpoint 回報進度，讓用戶在下一輪調整方向
把用戶輸入當戰略路線修正，不是即時操舵

如果頻道可中斷（CLI）那是 bonus，不是前提。框架不該依賴可中斷性。

Skill fallback：沒有 PUA 也要能跑

如果你在多台機器工作，可能某台有 pua:pua-debugging skill、某台沒有。框架要具備graceful degradation：

Skill 優先：有 PUA / systematic-debugging skill 時，讓 hunter 載入 — skill 是維護中的、品質更新快
Brain 兜底：把 PUA 的核心精神內嵌到 brain 檔，確保沒 skill 的機器也能按內建規則運作

內嵌的規則例如：「假設你的第一個假設是錯的，立刻列出兩個會產生同樣症狀的替代方案」、「修好了 trigger 下一個問題：為什麼以前會壞？」、「症狀只能『大致』解釋 = 沒被解釋，真正的 root cause 能解釋所有觀察，包含奇怪的那些」。這套 inline rule 讓 brain 成為 skill 缺席時的 safety net。

結案 checklist

一個 bug 追查只有在全部滿足以下條件才算完：

Bug 可重現（或明確記錄為何無法重現）
根本原因以白話講清楚
修復已驗證（重現原 failure → 套用 fix → 確認 failure 停止）
爆炸半徑評估（同一個 root cause 還可能壞掉什麼？）
Brain 檔已更新（domain 對、[source: project] tag 已加）
Commit message 以 fix: 開頭，而且 brain 更新發生在開始下一個 task 之前

為什麼這套設計 model-agnostic

整套 Brain + Skill + Agent Team 設計最大的優勢是 model-agnostic：未來換 Opus 5.0、換 Gemini 3、換 GPT-5，只要該模型支援讀檔案 + 自訂 instruction 機制，整套可以直接搬過去。

Auto cross-session memory 綁在 Claude Code 內建機制上，換 tool 就沒了。自建 Brain 是把架構設計前置到模型之外 — 模型只負責執行，架構你自己定。結果是：

4.7 再強，沒 Brain 也是亂塞
4.6 再弱，有 Brain 也能跑
未來換任何 LLM，這套設計直接移植

這其實很接近個人化 RAG 系統的雛形 — 只是沒用 vector DB，用人類可讀的 markdown + 手動路由。反而更可控、更可維護。

結論

Claude 4.7 的 memory 和 Agent Team 改進都是實實在在的能力提升，但對已經有自建知識架構的開發者來說，真正的護城河不在追著升級模型，而在建立 model-agnostic 的架構設計。

Memory：用 Brain 做跨專案長期記憶、用 MEMORY.md 做專案短期筆記、用 Skill 存對的做法 — 三者分工明確。
Agent Team：宏觀 Team A/B/C 並行處理不同主題 + 微觀 Named sub-agent 保持任務延續性 — 互補使用最強。
Bug 追查：方法論（PUA）× 容器（Named agent）× 事後教訓（Brain 更新）三層結構，對頻道韌性和 skill 缺席都要有 fallback。

模型會一代代升級，但你累積的 Brain 不會過時 — 因為它記錄的不是模型能力，是你自己踩過的坑和學到的道理。

2026 年 4 月 20 日

Hacker News 每日精選 – 2026-04-20
🚀 Hacker News 今日技術趨勢洞察

今日科技圈的核心主題圍繞著「系統的韌性與脆弱性」展開：從 Vercel 的安全漏洞事件到全球半導體供應鏈中溴元素的關鍵瓶頸。理解這些技術基礎設施與地緣政治如何交織影響數位世界，是每位技術決策者與開發者的必修課。

🤖 AI/機器學習

Claude Token 統計工具：新增模型比較功能 📊

這款工具現在不僅能計算 Claude 的 Token 使用量，還新增了不同模型之間的對比功能。對於需要精準控制 Prompt 成本與優化模型效率的開發者來說，這是一個極具價值的工具。透過視覺化對比，使用者可以更直觀地理解不同模型在處理長文本時的差異。
- 支援 Claude 系列模型的 Token 計數
- 新增模型間的消耗對比功能
- 幫助開發者優化 LLM 應用成本
原文連結：Claude Token Counter, now with model comparisons

🛠️ 開發工具

Vercel 2026 年 4 月安全事件：雲端平台的安全警訊 ⚠️

Vercel 已確認發生安全漏洞事件，且有駭客聲稱正在出售竊取的數據。這起事件在社群引起高度關注，提醒了所有依賴 Serverless 與託管平台的開發者，雲端供應鏈安全的重要性不容忽視。面對此類事件，及時的資安審查與補救措施至關重要。
- Vercel 確認遭遇數據外洩攻擊
- 駭客市場出現相關數據交易資訊
- 提醒開發者重新檢視雲端資安配置
原文連結：Vercel April 2026 security incident

Stripe 付款 API 的設計十年回顧 💳

這篇文章深入探討了 Stripe 如何在過去十年中，透過優異的 API 設計建立起全球支付帝國。文章分析了 API 設計中的權衡、擴展性以及如何透過開發者友好的介面建立信任。對於想要設計大規模、高可靠性系統的工程師來說，這是一篇必讀的教科書級文章。
- 回顧 Stripe API 的演進歷程
- 解析高品質 API 設計的核心原則
- 探討開發者體驗（DX）對產品成功的影響
原文連結：Stripe’s Payment APIs: the first 10 years (2020)

Rust 語言的零拷貝 Protobuf 與 ConnectRPC 實作 🦀

本文介紹了如何在 Rust 環境中利用零拷貝（Zero-copy）技術來提升 Protobuf 的效能。透過減少記憶體拷貝的開銷，ConnectRPC 能夠在保持高開發效率的同時，極大化網路通訊的吞吐量。這對於追求極致效能的分散式系統開發非常有參考價值。
- 探討 Rust 中的零拷貝序列化技術
- 使用 ConnectRPC 優化通訊效能
- 提升高效能微服務的處理能力
原文連結：Zero-copy protobuf and ConnectRPC for Rust

💼 創業/商業

溴元素供應瓶頸：影響記憶晶片生產的地緣政治風險 🧪

文章深入分析了中東局勢如何可能導致溴（Bromine）供應中斷，進而衝擊全球記憶晶片的生產。溴是製造半導體不可或缺的關鍵材料，這篇報導揭示了硬體供應鏈中隱藏的脆弱節點。地緣政治風險已不再僅是政治議題，更是科技產業必須面對的商業挑戰。
- 分析溴元素在半導體產業中的關鍵地位
- 探討中東衝突對供應鏈的潛在衝擊
- 預警全球記憶晶片生產可能面臨的風險
原文連結：The Bromine Chokepoint

🎨 其他

停止試圖用「工程手段」來規避傾聽他人 👂

這是一篇關於軟技能的深刻反思。作者指出，許多技術專業人士習慣於用邏輯、流程或工具來解決人際溝通中的問題，卻往往忽略了「真正的傾聽」才是關鍵。在團隊協作中，過度依賴系統化流程而忽視人性互動，往往會導致溝通斷層。
- 反思技術思維在人際溝通中的局限性
- 強調「主動傾聽」在軟技能中的核心地位
- 提醒開發者在解決問題前先理解需求
原文連結：Stop trying to engineer your way out of listening to people

機械鍵盤聲音博物館 ⌨️

一個極具趣味性的數據視覺化專案，透過聲音展示了不同機械鍵盤軸體的獨特特性。對於鍵盤愛好者來說，這不僅僅是聲音的集合，更是一場感官的數位饗宴。
- 透過聲音呈現機械鍵盤的多樣性
- 精彩的數據視覺化呈現
- 鍵盤玩家的感官探索工具
原文連結：Mechanical Keyboard Sounds – A listening Museum

魚露的簡短歷史 🐟

跳脫技術，這篇文章帶領讀者探索魚露這種調味料的文化與歷史演進，展現了人類飲食文化中深厚的層次感。

原文連結：A Brief History of Fish Sauce

挪威考古新發現：早於維京時代的船葬遺址 🚢

考古學家在挪威發現了壯觀的船葬遺址，其年代甚至早於我們熟知的維京時代，這項發現可能將重寫北歐早期的歷史敘事。

原文連結：Monumental ship burial beneath ancient Norwegian mound predates the Viking Age

Ben Lerner 的大情緒 📖

關於文學與創作者情感的深度訪談，適合在技術思考之餘，進行人文層面的探索。

原文連結：Ben Lerner’s Big Feelings

💡 今日觀點與行動建議

從今日的新聞清單中，我們可以看到一個明顯的趨勢：「穩定性與安全性」。無論是雲端平台的資安漏洞、半導體供應鏈的地緣政治風險，還是 API 設計中的穩定性考量，都在提醒我們：在追求快速迭代與新技術（如 AI）的同時，必須建立更強大的防禦與韌性機制。

給讀者的行動建議：
- 資安檢查： 檢視您目前使用的託管服務與第三方 API，確保資安策略與最新的風險趨勢一致。
- 廣度學習： 不要只看代碼，試著理解硬體供應鏈（如溴元素）與地緣政治如何影響您的技術架構與成本。
- 軟實力投資： 記住，再完美的工程流程也無法取代高品質的人際傾聽與溝通。
2026 年 4 月 20 日
Hacker News 每日精選 – 2026-04-19
🚀 Hacker News 精選：AI 性能對決與技術演進的深度觀察

今日科技圈最值得關注的趨勢在於「技術加速與社會應對的拉鋸戰」。一方面，大型語言模型（LLM）的效能評測正進入更細緻的數據對比階段；另一方面，教育界與開發者正試圖透過回歸傳統工具或理解底層邏輯，來應對技術爆炸帶來的衝擊。

閱讀今日整理的內容，你將能從最新的 AI 性能數據、遊戲開發的技術債，到極其硬核的機械工程歷史，全面掌握當前技術圈的多元脈動。

🤖 AI / 機器學習

Anonymous request-token comparisons from Opus 4.6 and Opus 4.7
（Opus 4.6 與 4.7 的匿名 Request-Token 性能對比）
- 透過匿名的 Request-Token 測試對比不同模型版本。
- 為開發者提供更客觀的模型效能基準。
- 深入探討模型在處理 Token 時的效率差異。
👉 查看原文連結

College instructor turns to typewriters to curb AI-written work
（大學教師重拾打字機，以遏止 AI 代寫作業）
- 面對 AI 生成內容的衝擊，教學方法正發生根本性轉變。
- 透過使用打字機等傳統工具，強制學生回歸思考與書寫過程。
- 探討在 AI 時代，如何重新定義學術誠信與學習價值。
👉 查看原文連結

🛠️ 開發工具

Updating Gun Rocket through 10 years of Unity Engine
（跨越 10 年 Unity 引擎更新：Gun Rocket 的維護歷程）
- 分享將一個長達十年的遊戲專案升級到最新引擎的實戰經驗。
- 深入探討技術債與引擎版本迭代帶來的挑戰。
- 對於長期維護舊專案的開發者具有極高的參考價值。
👉 查看原文連結

What are skiplists good for?
（Skip Lists 數據結構有什麼用處？）
- 深入分析 Skip Lists 的原理與應用場景。
- 探討其在處理快速搜尋與動態數據更新時的優勢。
- 提供電腦科學底層數據結構的技術深度分析。
👉 查看原文連結

Game Devs Explain the Tricks Involved with Letting You Pause a Game
（遊戲開發者揭秘：讓遊戲暫停背後的技術奧秘）
- 解釋遊戲引擎如何處理「暫停」狀態的底層邏輯。
- 探討在複雜系統中，暫停功能可能導致的非預期行為。
- 從開發者視角解構遊戲狀態管理的難點。
👉 查看原文連結

💼 創業 / 商業 / 社會建設

Why Japan has such good railways
（為什麼日本的鐵路系統如此優秀？）
- 從系統工程與社會規劃的角度解析日本鐵路的成功關鍵。
- 探討基礎建設如何影響經濟效率與城市發展。
- 為現代都市規劃與大型系統管理提供啟示。
👉 查看原文連結

🧪 其他（硬體、科學與理論）

NIST scientists create ‘any wavelength’ lasers
（NIST 科學家研發出「任意波長」雷射）
- 研發出可在微型電路中運作、具備任意波長的雷射技術。
- 這項突破將對光學通訊與微型化光學元件產生重大影響。
- 提升了光子晶體技術在未來精密儀器中的應用潛力。
👉 查看原文連結

The electromechanical angle computer inside the B-52 bomber’s star tracker
（B-52 轟炸機星軌追蹤器中的機電式角度計算機）
- 回顧經典航空工程中，使用機電裝置進行高精度計算的技術。
- 展示在數位時代之前，人類如何透過精密的機械結構解決複雜問題。
- 極具收藏與研究價值的硬體工程史實。
👉 查看原文連結

The becquerel as an SI unit for request rate
（提議將貝克勒爾作為請求率的國際單位）
- 提出一種將物理學單位應用於計算機請求頻率的有趣理論。
- 嘗試建立更標準化、具備物理意義的軟體效能度量指標。
- 結合物理學與資訊工程的跨領域思維實驗。
👉 查看原文連結

Metatextual Literacy
（元文本素養）
- 探討閱讀與理解文本背後深層結構的能力。
- 在資訊碎片化的時代，重新審視深度閱讀的重要性。
👉 查看原文連結

💡 今日觀點

共同主題總結： 今日的文章展現了技術發展的「雙向性」。我們既能看到 NIST 研發的極限雷射與 LLM 的性能對比，代表著人類向「更精準、更高效」的極限前進；同時，從大學教師使用打字機、到維護十年前的 Unity 遊戲，也反映出我們必須學會與「舊技術、舊邏輯」共存，並在技術狂飆中尋找穩定性與本質。

🚀 給讀者的行動建議：
不要只追求最新、最快的技術工具。當你在使用 AI 提高效率時，請時刻保持對「底層邏輯」（如數據結構、物理原理、系統架構）的理解。唯有理解了這些「慢技術」，你才能在「快技術」的浪潮中，不至於迷失方向。
2026 年 4 月 19 日
Hacker News 每日精選 – 2026-04-18
“`html

今日科技趨勢精選

🚀 今日科技趨勢精選：AI 成本、開發哲學與未知的科學邊界

今日趨勢觀察： 科技圈正處於 AI 模型極速演進與開發者回歸「基礎開發能力」的拉鋸戰中。當 Claude 等模型不斷優化其設計與成本結構時，工程師們也開始重新審視「手寫程式碼」與「工具信任度」的核心價值。

閱讀本文，你將掌握從 AI 模型經濟學到深層開發工具哲學的最新洞察，這對於任何想在 AI 時代保持競爭力的技術人來說都至關重要。

🤖 AI / 機器學習

🎨 Claude 設計哲學：Anthropic 的視覺與交互演進

本文探討了 Anthropic 如何為 Claude 打造更直覺且一致的設計語言。隨著 AI 從單純的對話框轉向更複雜的協作工具，設計的細節將決定使用者能否更有效地與模型互動。這不僅是介面的改變，更是人機協作模式的重塑。
- 查看原文
💰 深入剖析：Claude 4.7 Tokenizer 的成本測量

對於開發者而言，Token 的成本直接影響產品的獲利能力。這篇文章透過實驗數據，精確測量了 Claude 4.7 新型 Tokenizer 的表現與實際成本。理解這些微小的差異，對於優化 LLM 應用程序的效能至關重要。
- 查看原文
📈 警訊：AI Agent 的運算成本是否正呈指數級增長？

隨著 AI Agent（智能代理）成為開發熱點，其運行的複雜度也隨之提升。本文探討了在 2025 年的背景下，維持 Agent 持續運作的經濟成本是否會像算力需求一樣，呈現令人擔憂的指數級增長趨勢。
- 查看原文
🛠️ 開發工具

🧮 區間計算機：處理不相交區間集合的神器

這是一個非常硬核的數學工具開發展示。作者展示了如何製作一個能夠在「不相交區間集合」上進行運算的計算機，對於需要處理複雜數值區間的科學計算或工程應用來說，這是一個極具參考價值的開源專案。
- 查看原文
🛡️ 信任的建立：如何在 Emacs 環境中追求安全性

Emacs 以其強大的擴充性著稱，但這也帶來了安全性挑戰。本文深入探討了在高度自定義的 Emacs 環境中，如何從架構與使用習慣上建立信任感，讓開發者能在享受強大功能的同時，不至於犧牲系統安全性。
- 查看原文
✍️ 深度反思：連續三個月「純手寫」程式碼的體驗

在 AI 輔助編碼（Copilot）橫行的時代，作者嘗試回歸原始，進行了為期三個月的純手寫編碼實驗。這篇文章不僅是關於開發技術的紀錄，更是一場關於人類認知、肌肉記憶與程式思維深度的哲學探討。
- 查看原文
🔓 開源專案

🇳🇴 Brunost：使用挪威語（Nynorsk）編寫的程式語言

這是一個充滿文化色彩的開發專案。作者介紹了一種名為 Brunost 的程式語言，其語法與邏輯深受挪威語（Nynorsk）的影響。這展示了程式語言設計中，文化與語言如何賦予技術全新的維度。
- 查看原文
🌌 其他

🌑 月球花粉熱：太空探索中的隱形威脅

科學研究發現，所有 12 位登月的太空人都有過類似「花粉熱」的症狀，原因竟是月球塵埃聞起來像火藥。這篇文章揭示了月球環境對人類生理影響的未知性，對於未來的登月計畫具有重要的警示意義。
- 查看原文
🔬 物理模型：Fil-C 的簡化模型研究

這是一篇偏向科學研究的內容，介紹了對於 Fil-C 的簡化建模方法。對於對複雜系統建模感興趣的讀者來說，這提供了從複雜現象中提取核心物理邏輯的思考方式。
- 查看原文
📖 科幻經典：阿西莫夫的《最後的問題》

重新閱讀經典是不錯的選擇。阿西莫夫這篇關於熵增、機器智能與宇宙終局的科幻神作，在 AI 技術爆炸的今日，讀起來竟有種跨越時空的震撼感。
- 查看原文
💡 今日觀點與行動建議

核心主題： 今日的資訊流呈現出一個有趣的對比——一邊是 AI 模型的「成本與效率」競爭（Claude 的設計與 Token 成本），另一邊則是人類開發者對「開發本質」的回歸與反思（手寫程式碼、Emacs 的信任問題）。

給讀者的行動建議：
- 優化你的 AI 工作流： 不要只會使用 Prompt，開始關注 Tokenizer 的成本與 Agent 的經濟效益，這將決定你開發 AI 產品的商業天花板。
- 保持「底層能力」的練習： 在 AI 幫你寫程式的時代，定期嘗試「不依賴 AI」進行核心邏輯開發，這能幫助你保持對系統底層與邏輯深度的掌控力。
- 關注工具的安全性： 無論是使用 Emacs 還是 AI 插件，始終保持對工具信任度的批判性思考，確保開發環境的純淨與安全。
“`
2026 年 4 月 18 日
Hacker News 每日精選 – 2026-04-17
“`html

今日科技趨勢速報

🚀 今日科技趨勢速報：從 AI 模型進化到硬體自動化的全面轉型

今日科技圈最引人注目的趨勢是 「AI Agent（智能體）」正在從純軟體領域跨足至硬體與工程專業領域。我們看到的不再只是聊天機器人，而是能進行電路模擬、控制機器人手臂、甚至加速 Android App 建置的深度集成工具。這標誌著 AI 正從「輔助寫程式」轉向「自主完成工程任務」的新階段。

🤖 AI / 機器學習

Claude Opus 4.7 重磅發布：強大的推理能力再進化 🚀

Anthropic 推出了其旗艦模型 Claude Opus 4.7，展現了更卓越的邏輯推理與複雜問題解決能力。這次更新不僅提升了處理長文本的精準度，更在程式碼理解與數學推理上取得了重大突破。對於需要高穩定性與深度邏輯的開發者來說，這是目前市場上最強大的競爭者之一。

原文連結

Codex 邁向全方位應用：不僅僅是程式碼生成 🤖

OpenAI 展示了 Codex 模型如何擴展至幾乎所有的數位化任務。這不僅限於寫程式，更包含了理解複雜指令並將其轉化為實際行動的能力。這預示著未來軟體開發的範式將從「手動編寫」全面轉向「意圖驅動」。

原文連結

從電路模擬到硬體驗證：利用 Claude Code 自動化電子工程流程 ⚡

這是一個令人驚嘆的示範，展示了如何利用 Claude Code 將 SPICE 電路模擬、示波器數據與硬體驗證流程串聯起來。開發者可以透過 AI 自動化處理繁瑣的電路測試與數據對比。這證明了大型語言模型在高度專業化的電子工程領域中具有巨大的應用潛力。

原文連結

駭客精神：利用 AI 與廢料打造自動化硬體實驗手臂 🛠️

一位硬體駭客利用膠帶、舊攝影機與 CNC 機台，成功打造出一個由 AI 驅動的硬體探針手臂。這個專案展示了如何利用低成本硬體結合 AI 視覺與控制能力，實現自動化的硬體測試任務。這充分體現了開源精神與 AI 技術結合後的無限可能。

原文連結

🛠️ 開發工具

Android CLI 升級：利用 Agent 讓 App 建置速度提升 3 倍 📱

Google 推出了全新的 Android CLI 工具，旨在透過 Agent 技術大幅優化開發流程。透過智慧化的指令處理，開發者可以更快速地執行複雜的建置與部署任務。這項更新對於追求開發效率的 Android 工程師來說是重大的利好。

原文連結

透過 Tree-sitter 提升 R 語言的開發體驗 📊

透過引入 Tree-sitter 技術，R 語言的開發環境得到了顯著改善。Tree-sitter 提供更精準的語法解析，讓程式碼高亮、跳轉與自動完成變得更加流暢。這對於從事數據科學與統計研究的用戶來說，提升了極大的開發品質。

原文連結

用 Python 寫一個 Python 解釋器：深入底層邏輯的探索 🐍

這是一篇深入淺出的技術文章，探討如何使用 Python 本身來實作一個 Python 解釋器。透過這種「自我解釋」的方式，讀者可以更直觀地理解程式語言的解析、編譯與執行原理。對於想要深入學習編譯器原理的開發者來說，是極佳的學習教材。

原文連結

📂 開源專案

CadQuery：使用 Python 進行 3D CAD 模型建模的開源利器 📐

CadQuery 是一個基於 Python 的開源程式化 CAD 建模庫。它允許開發者透過撰寫程式碼而非手動拖拽，來精準地建構複雜的 3D 模型。這種「以程式碼驅動設計」的方式，非常適合需要進行參數化設計與自動化建模的工程師。

原文連結

ReBot-DevArm：開源機器人手臂專案 🤖

這是一個由 Seeed Studio 發起的開源機器人手臂專案，旨在降低開發者進入機器人領域的門檻。透過提供完整的硬體設計與軟體支持，讓開發者能輕鬆進行機器人控制與 AI 演算法的實驗。這對於教育與原型開發非常有價值。

原文連結

🎞️ 其他

Clojure 官方紀錄片：探索函數式程式語言的生命力 📽️

Clojure 官方發布了一部關於該語言發展歷程的紀錄片，包含影片、筆記與相關連結。影片深入探討了 Clojure 社群的核心價值與技術理念。對於對函數式程式設計感興趣的開發者，這是一次難得的文化洗禮。

原文連結

💡 今日觀點與總結

今日核心主題：從「軟體助手」轉向「工程智能體」。

觀察今日的熱門文章，我們可以發現一個明顯的軌跡：AI 正在從單純的文字生成，轉向具備「操作工具」與「理解物理世界」的能力。無論是結合電子工程模擬、操控機器人手臂，還是加速系統級的建置流程，AI 正在成為一個具備「執行力」的角色。

📢 給讀者的行動建議：
- 擁抱 Agentic Workflow： 不要只把 LLM 當成聊天工具，開始嘗試將其與你的開發工具（如 CLI、CAD 或測試框架）結合，學習如何撰寫能讓 AI 驅動流程的指令。
- 關注跨領域技能： 未來的工程師需要具備「軟硬體結合」的思維。了解如何利用 AI 來彌補你在特定專業領域（如電子工程或機械設計）的知識缺口，將是極大的競爭優勢。
- 掌握參數化思維： 如 CadQuery 的成功所示，將設計轉化為程式碼將是未來的趨勢，建議開始練習以程式碼而非 GUI 來進行建模或配置。
“`
2026 年 4 月 17 日
Hacker News 每日精選 – 2026-04-16
“`html

今日科技趨勢精選

🚀 今日科技趨勢精選：從 AI 去中心化到網路協議的里程碑

今日的技術動態顯示，我們正處於一個「轉型期」：AI 的算力正嘗試從雲端走向邊緣設備，網路基礎設施正全面邁向 IPv6，而網路安全的防禦成本也正變得如同加密貨幣的「工作量證明」般高昂。掌握這些底層變革，將是開發者維持競爭力的關鍵。
🤖 AI / 機器學習

Darkbloom – 利用閒置 Mac 進行私密推論 💻

這項新技術旨在利用大家手中閒置的 Mac 硬體資源，來進行私密的 AI 推論。這不僅能降低對昂貴雲端 GPU 的依賴，更從根本上解決了數據隱私的疑慮。對於追求邊緣運算與分散式架構的開發者來說，這是一個非常值得關注的方向。
- 官方網站
- HN 討論區
停止使用 Ollama？🛑

這是一篇針對當前 AI 本地部署熱門工具 Ollama 的深度反思。作者探討了在某些特定需求下，Ollama 可能存在的侷限性，並建議開發者在選擇工具時應更具批判性，思考是否有更靈活或更底層的替代方案。這反映了 AI 工具鏈正從「追求方便」轉向「追求精準控制」的階段。
- 閱讀原文
- HN 討論區
🛠️ 開發工具與工程實踐

從 StatsD 遷移大規模度量管線至 OpenTelemetry / Prometheus 📊

本文詳細介紹了 Airbnb 工程團隊如何將大規模的度量數據管線（Metrics Pipeline）進行架構遷移。透過引入 OpenTelemetry 與 vmagent，他們成功解決了在高併發環境下的觀察性挑戰。這對於正在處理大規模分佈式系統的工程師來說，是極具價值的實戰案例。
- 工程部落格原文
- HN 討論區
利用 Trie 樹實現快速且簡單的 Levenshtein 距離演算法 🧬

如果你需要處理大量的模糊字串比對，這篇文章提供了優化的思路。透過結合 Trie (字典樹)，可以大幅提升計算編輯距離（Levenshtein distance）的效率。這對於開發搜尋引擎、自動校正功能或自然語言處理工具的開發者非常有幫助。
- 技術文章原文
- HN 討論區
🛡️ 資訊安全與網路

網路安全正演變成一種「工作量證明」 🛡️

作者提出了一個深刻的觀點：隨著攻擊技術的演進，防禦者的成本與難度正呈現指數級增長，這與加密貨幣中的 Proof of Work (PoW) 機制極其相似。這意味著未來的網路安全將不再只是關於「防禦」，更多的是關於如何投入足夠的資源與複雜度來維持安全邊界。
- 深度觀點原文
- HN 討論區
RedSun：關於 Windows 系統使用者權限的研究 🔍

這是一項針對 Windows 10/11 及 Server 版本在特定更新後的系統使用者權限研究。這類技術性的安全漏洞分析對於維護企業級系統安全至關重要，提醒了開發者與系統管理員持續關注系統底層權限變動的重要性。
- GitHub 專案連結
- HN 討論區
FSF 針對 Gmail 垃圾郵件問題向 Google 施壓 📧

自由軟體基金會 (FSF) 正試圖聯繫 Google，針對使用 Gmail 帳號大量發送垃圾郵件的行為進行追蹤。這反映了大型郵件服務商在處理濫用行為時的挑戰，以及社群對大型平台責任感的持續監督。
- 詳細報導
- HN 討論區
🌐 其他技術趨勢

IPv6 流量正式跨越 50% 大關 📈

這是一個歷史性的里程碑。根據 Google 的統計數據，全球 IPv6 的流量佔比已正式超過 50%。這標誌著網路協議的世代交替已進入成熟期，所有的開發者與企業都應確保其服務具備完整的 IPv6 相容性。
- Google 統計數據
- HN 討論區
關於「紙本電腦」的哲學思考 📄

這是一篇帶有哲學色彩的文章，探討了計算機的概念在不同介質上的可能性。它引發讀者思考：當我們定義「計算」時，硬體介質是否真的有其絕對的邊界？
- 閱讀原文
- HN 討論區
回顧日本的舊式電話服務：NaviDial 📞

本文帶領讀者深入了解日本經典的 Legacy 電話服務 NaviDial。透過對這些技術歷史的挖掘，我們可以理解通訊技術是如何從類比時代演進到數位時代的。
- 閱讀原文
- HN 討論區
💡 今日觀點總結

整理今日的熱門話題，我們可以看到一個明顯的趨勢：技術正在變得更加分散化與標準化。

AI 算力不再只屬於雲端巨頭（Darkbloom），網路協議正朝向標準化的 IPv6 邁進，而工程實踐也越來越強調使用 OpenTelemetry 等標準化工具來應對大規模系統。同時，安全防禦的難度正在大幅提升，這要求我們必須從「被動修補」轉向「主動架構設計」。

📢 給讀者的行動建議：
- 檢查你的架構： 確保你的應用程式已經做好 IPv6 的支援，這已不再是選項，而是趨勢。
- 重新審視工具鏈： 不要盲目跟隨 AI 工具的熱度（如 Ollama），在部署前先評估其在你的生產環境中的擴展性與安全性。
- 投資可觀測性： 如果你的系統正在成長，現在就是從傳統監控轉向 OpenTelemetry 標準化架構的最佳時機。
“`
2026 年 4 月 16 日

你的 AI Agent Team 為什麼越做越小?視角驅動的編制方法論

重點摘要

你以為的「3 個 Agent 上限」可能是創傷的外推,不是設計 — 來自一次 OOM 事故的過度修正,結果反過來殺死你專案的角色細分工
正確的限制是記憶體預算,不是數量 — 16GB 機器可用 ~11GB agent 預算,混合模型(Opus/Sonnet/Haiku)可以安全跑 8+ 個專職 agent
但更深的問題是:角色不是頭銜,是視角 — 你該問「這個計畫需要哪些思考視角」,不是「我有幾個 slot」
三個永遠不能省的視角:使用者、PM、測試者 — 即使是純技術、只有 Python、只有你一個人的專案,這三個視角的思考必須發生
視角打分模型:每個視角用「風險 × 範圍」打 0-9 分,高分獨立成 agent,低分 fold 到其他 agent 的 prompt
反直覺發現:小任務(3 行 API)比大任務更需要資深視角(架構師、運維、測試),因為實作已經不是風險,「該不該存在」才是
壞規則會透過 template anchoring 自我強化 — 修了 runtime 規則還不夠,必須連 template 一起改

我的 AGENTS.md template 有一條規則:Agent Team 最多 3 個同時跑。這條規則是對的 — 直到我發現它正在偷偷殺死我的專案設計。

這篇文章是一趟很誠實的反思紀錄。從一次 16GB 機器 OOM 當機開始,到發現我對 AI Agent Team 的所有規則其實都建立在錯誤的抽象層上。結論不是「解除限制、大膽開 agent」,而是更根本的東西:角色根本不是我以為的那個東西。

第一層:我的規則其實是創傷,不是設計

事情是這樣開始的。2026 年 3 月 3 日,我嘗試在 16GB 的 Mini PC 上同時跑 9 個 Opus agent 做大型重構,結果系統 OOM 當機。從那一天起,我的 MEMORY.md 多了一條 Iron Rule:「Agent Team 最多 3 個同時跑」。

這條規則是理性的。9 個 Opus × 1GB ≈ 9GB,加上系統和 Docker 的常態佔用,16GB 當然吃不下。3 個是「經驗上安全」的數字。但我沒注意到一件事:這條規則是在「全 Opus」的情境下歸納出來的。我直接把它當成所有情境的通用上限,沒考慮混合模型的狀況。

更糟的是,這條規則開始滲透到我的 AGENTS.md template、我的專案計畫、我對每個新專案的初始設計。結果是:即使某個專案明明應該有架構師、後端、前端、Kafka、SQL、Test、PM、QA 八個角色,我也會「收斂」到「全端 + 檢查者 + 架構師」三人組。我不是選擇了簡化設計,是我被一條舊規則綁架了設計想像力。

第二層:記憶體預算制取代數量制

第一個修正很直覺:限制應該是記憶體總量,不是 agent 數量。16GB 機器扣掉系統和 Docker 的 ~5GB,還剩 ~11GB 可以給 agent 用。而不同模型的記憶體占用差很多:

模型	記憶體	適合任務類型
Opus	~1.0 GB	架構決策、跨檔案推理、複雜邏輯、資深思考
Sonnet	~0.6 GB	實作、API、測試、文件
Haiku	~0.4 GB	檔案掃描、config 對照、簡單查詢

換算一下:一個架構師(Opus 1.0)+ 兩個後端(Sonnet × 2 = 1.2)+ 前端(Sonnet 0.6)+ SQL(Sonnet 0.6)+ Kafka(Sonnet 0.6)+ Test(Sonnet 0.6)+ QA + PM(Haiku × 2 = 0.8)= 5.4 GB,8 個 agent。完全在 11GB 預算內,還有 5.6GB 的 headroom。

所以「3 個 agent」的舊規則其實是錯的。正確的說法是「全 Opus 時 ≤ 3 個;混合模型時可以到 8+ 個,只要總和在預算內」。這一步修完,我理論上可以解鎖原本想要的專職團隊設計。

但這還不夠:我一直在錯的抽象層解決問題

我以為修到這裡就結束了。結果真正的問題還在更上面一層。

記憶體預算制解決了「能不能開 8 個 agent」的技術問題,但沒解決「我該開哪 8 個角色」的設計問題。我仍然在用「頭銜思維」想 Agent Team — 有一個固定的角色清單(架構師、後端、前端、QA…),看看預算能放幾個,從清單挑幾個進來。

這個思維的錯誤在哪?它把「角色」當成頭銜 / headcount,而角色的本質其實是視角 / perspective — 一種「怎麼思考這件事」的觀點。兩個是完全不同的東西:

思維	頭銜 Headcount	視角 Perspective
單位	angular-dev、backend-dev	「使用者會怎麼用」「PM 會怎麼想」
數量	固定清單	每個 plan 動態決定
「只有 Python」專案	1 個 Python dev 就好	仍需使用者、PM、測試視角
小任務(3 行)	給最便宜的 dev	可能需要最資深的運維視角

三個永遠不能省的視角

這是最實用的一條發現。不管你的專案是什麼技術、什麼規模、幾個人做,這三個視角永遠必須存在:

使用者視角 — 誰會用這個東西?他們的心智模型是什麼?介面怎麼設計才順?
PM 視角 — 這件事符合大方向嗎?是現在最該做的嗎?會影響別的優先級嗎?
測試者視角 — 什麼會壞?邊界 case 在哪?漏掉什麼?失敗模式是什麼?

這三個視角可以 fold 到其他 agent 的 prompt 裡(例如讓 backend-dev 在設計階段戴 PM 帽子),但絕對不能默默省略。省略它們的結果是:你會產出「技術上正確、實用上無用」的東西 — API 能跑但沒人想用、feature 完成但 PM 說這不是重點、code 過 review 但上線就爆 edge case。

「只有 Python」不是跳過使用者視角的理由。「只有你一個人」不是跳過 PM 視角的理由。「只是改一行」不是跳過測試者視角的理由。這三個視角的思考必須發生,差別只在「由誰承擔」,不在「要不要做」。

視角打分模型:風險 × 範圍

光知道「要列視角」還不夠,還要知道哪些重要、哪些次要。我用的打分模型很簡單:Score = Risk × Scope,兩個維度都是 0-3,總分 0-9。

風險:這個視角漏掉的話多慘?(0 = 無所謂,3 = 災難)
範圍:這個視角涉及多少產出物?(0 = 無,3 = 全部)

分數算出來後按以下規則分組到 agent:

Score ≥ 6:獨立 agent,很可能要用 Opus 或高階 Sonnet
Score 3-5:獨立 agent,或跟另一個視角配對(Sonnet)
Score 1-2:fold 到其他 agent 的 prompt,明確列入該 agent 的優先順序
Score 0:在計畫裡 acknowledge 就好,不花 agent 資源

最後檢查記憶體預算是否超過 11GB,超過就把分數最低的兩個合併。

反直覺發現:小任務需要更資深的視角

這是這整套方法論裡最違反直覺、也最容易忽略的一條。實作越簡單的任務,反而越需要資深視角。

原因很微妙:大任務的風險分散在許多實作細節裡,實作者視角得分最高(因為「寫錯」的機率大)。但小任務的實作幾乎免費 — 風險已經轉移到別的地方了:「這東西該不該存在」(架構師視角)、「會不會在奇怪情境下爆」(測試者視角)、「運維怎麼用這個 endpoint 做決策」(運維視角)。

具體例子:幫一個 Docker 服務加 /health endpoint,回 {"status": "ok"}。

實作者視角:風險 1 × 範圍 1 = 1 分(3 行誰都會寫)
運維視角:風險 3 × 範圍 2 = 6 分(這個 endpoint 決定服務要不要被 monitoring 重啟)
架構師視角:風險 3 × 範圍 1 = 3 分(「健康」的定義是最大問題)
測試者視角:風險 2 × 範圍 1 = 2 分
使用者視角:風險 2 × 範圍 1 = 2 分

結論:這個任務要派一個 Sonnet agent,但 prompt 的優先順序是運維 > 架構 > 測試 > 使用者 > 實作。它不是「後端 dev 寫 3 行」,是「一個有運維腦袋的人剛好以 3 行 code 為產出」。

這個例子回答了我長久的困惑:「小任務該加一個專職 agent,還是從 tester 出發、還是從 dev 出發?」答案是 — 從得分最高的視角出發,不從頭銜出發。小任務通常是資深視角得分高,所以該派的不是 junior implementer,是帶著資深視角的人。

三個完整案例

案例 1:純 Python script(200 行,讀 CSV 做統計)

視角枚舉:Python 實作者、使用者、PM、測試者、架構師

打分:實作者 6、測試者 6(資料邊界 case 是真風險)、使用者 2、PM 1、架構師 1

分組:2 個 Sonnet(~1.2 GB)

Agent 1:實作 + 架構 + PM 視角(優先:實作)
Agent 2:測試 + 使用者視角(優先:測試 — 資料邊界主導)

2 個 agent,但 5 個視角都被想過了。要的是「每個視角都有思考發生」,不是「每個視角都有一個人」。

案例 2:OMS 訂單退款功能(跨前後端/Kafka/SQL/admin)

視角枚舉:架構師、安全、後端、前端、Kafka、SQL、Admin UI、測試、使用者、PM、合規

打分:每個都 ≥ 4 分,因為範圍廣且風險高(金流)

分組:9 個 agent(~6.6 GB,預算內)

Architect(Opus)、Security(Opus)
Backend-dev、Frontend-dev、Kafka、SQL、Admin-UI、Tester(全部 Sonnet)
使用者 + PM + 合規視角 fold 到一個 Haiku

這就是大型專案值得完整專職團隊的時候。注意:即使 9 個 agent,使用者和 PM 視角還是被 fold 到一個 Haiku,不是各自獨立。視角沒被省,但不一定要佔獨立 slot。

案例 3:3 行 /health endpoint(已在前面詳細分析)

分組:1 個 Sonnet,所有 5 個視角都 fold,優先順序運維 > 架構 > 測試 > 使用者 > 實作。

計畫修訂時必須重算

一個容易忽略的點:staffing 是 live document,不是一次性決定。當計畫執行到一半發現:

新需求浮現(「喔原來這個也要接 Kafka」)→ 新視角需要打分,決定獨立或 fold
某視角發現其實很關鍵(原本 fold 的安全視角,發現有 PII 暴露)→ 升級為獨立 agent
某視角發現其實不必要(決定不做 admin UI)→ 該 agent 退場或重新分配

每次 plan 修訂都該觸發 staffing 重算。如果 AGENTS.md 跟當前 plan 不同步,應該先更新 AGENTS.md 再繼續 dispatch。

壞規則會自我強化 — template anchoring 的陷阱

最後我想分享一個元層級的教訓,是這整件事最讓我不舒服的部分。

我一開始以為只需要改 runtime 規則(把「3 個上限」改成「預算制」)就好了。但我後來發現:壞規則會透過 template 自我強化。我的 AGENTS.md template 原本的例子只有 2 個角色(implementer + reviewer),這個「低錨」讓我每次初始化新專案時,都自動往「3-5 個角色」的方向填,幾乎從不主動設計 7-10 個。

這形成一個 feedback loop:

創傷 → 記憶體規則收緊到「3 個」
Template 的例子反映記憶體規則 → 錨在低數量
我用 template 寫新 AGENTS.md → 產出低角色的設計
低角色的設計變成「標準」→ 我的記憶認為「就是這樣」
循環加強

光改規則不夠,template 也得改。我最後把 template 改成強迫跑完整個視角打分流程的版本:頂部要求先讀「視角驅動 staffing」的 brain,中間有「Perspective Inventory」區塊要你填每個視角的 Risk × Scope 分數,再下面是「Memory Budget」計算區塊。沒跑完流程根本填不完 template。

這個 template 和配套的方法論 brain 都放在公開的領域腦 repo裡,歡迎 clone 參考。

跟 VCS / 版本控制的關係

如果你讀過我之前那篇 Jujutsu vs Git,可能會問:視角驅動 staffing 跟 jj 有什麼關係?

答案是:沒有關係,而且這個順序很重要。視角驅動 staffing 是計畫期的事 — 你在寫 plan、決定 Agent Team 編制時發生。VCS(git / jj / worktree / workspace)是執行期的事 — Agent Team 已經成立、開始跑、產出變動需要合併的時候才登場。不能倒過來。

我之前一度把這兩件事混在一起寫(在「VCS + AI 工作流」的 brain 裡討論 Agent Team 編制),後來意識到這是錯的。Staffing 決定「要做什麼」,VCS 決定「做的產出怎麼合併」。兩者相關但獨立,混在一起會讓人以為「切到 jj 就能多開 agent」— 不是的,能多開 agent 是記憶體預算 + 視角分析的事,跟 VCS 無關。

結論:為什麼這個順序重要

我從「Agent Team 最多 3 個」走到「視角驅動編制」的這段路程,對我來說最重要的一個 meta-lesson 是:你的限制規則可能不是來自設計,而是來自創傷。一次系統炸掉的記憶,會變成一條 Iron Rule,然後透過 template anchoring 滲透到你所有未來的設計決策。

修復這種規則不能只修表面。你得:

檢視規則的原始情境 — 它是在什麼條件下產生的?那些條件還成立嗎?
把規則轉成可計算的東西 — 不是「最多 3 個」,是「11GB 預算」;不是「寫 3 行 API」,是「運維視角 6 分」
上升到更對的抽象層 — 從「數量」到「預算」是一次升級,從「頭銜」到「視角」是又一次升級
同時改 template — 不然新專案會繼承舊錨,規則永遠修不乾淨

這個流程不只適用 Agent Team 編制,適用任何你「歸納」出來的工程規則。下次你發現自己下意識地拒絕某個選項(「不能這樣做,會爆」),請誠實問自己:這個規則是設計來的,還是創傷來的?如果是後者,它可能正在偷偷殺死你的系統設計,而你根本沒意識到。

2026 年 4 月 15 日

Hacker News 每日精選 – 2026-04-15
“`html

科技趨勢早報

🚀 今日科技圈速報： 從 AI 輔助編程的規律化，到亞馬遜（Amazon）在衛星通訊領域的激進擴張，科技發展正呈現出「極度自動化」與「硬體基礎建設」並行的雙軌趨勢。同時，我們也看到開發者社群對數位考古與長青系統的執著，這提醒了我們在追求新技術的同時，理解底層邏輯與歷史脈絡的重要性。

🤖 AI/機器學習

🤖 Claude Code Routines | Claude 程式碼例行程序

這篇文章深入探討了 Anthropic 的 Claude 在處理程式碼任務時的自動化流程與最佳實踐。透過建立特定的規律（Routines），開發者可以更有效地與 AI 協作，減少人工干預並提高代碼生成的精準度。對於希望將 AI 融入開發工作流的專業人士來說，這是極具價值的指南。
- 查看原文
🛠️ 開發工具

📦 Dependency cooldowns turn you into a free-rider | 依賴冷卻期讓你變成了一個「搭便車者」

作者探討了軟體工程中一個容易被忽視的問題：過度依賴現有依賴項（Dependencies）而缺乏主動維護的心理。當我們只會「使用」而不去理解或貢獻時，會陷入技術債的泥淖。這篇文章對於構建可持續、穩定的軟體系統提供了深刻的反思。
- 查看原文
🔑 My adventure in designing API keys | 設計 API 金鑰的冒險之旅

設計 API 金鑰看似簡單，實則涉及安全性、易用性與系統架構的複雜權衡。作者分享了他在設計過程中的實戰經驗，從金鑰的生成邏輯到分發機制，解析了這項基礎建設背後的設計思考。
- 查看原文
🚀 創業/商業

🛰️ Amazon to acquire Globalstar and expand Amazon Leo satellite network | Amazon 將收購 Globalstar 並擴張 Amazon Leo 衛星網路

亞馬遜正展現其在低軌道衛星通訊領域的野心。透過收購 Globalstar，Amazon 旨在進一步強化其 Leo 衛星網路的覆蓋能力，這不僅是通訊技術的競爭，更是全球數位基礎設施佈局的關鍵一步。
- 查看原文
📂 開源專案

🐛 Fixing a 20-year-old bug in Enlightenment E16 | 修復 Enlightenment E16 中一個存在了 20 年的 Bug

這是一個關於開源精神的動人故事。一位開發者深入探討並修復了 Enlightenment E16 桌面環境中一個困擾了社群長達二十年的錯誤。這不僅是技術上的突破，更展現了開源開發者對代碼品質與歷史遺產的尊重。
- 查看原文
🐧 Installing OpenBSD on the Pomera DM250 Writerdeck | 在 Pomera DM250 Writerdeck 上安裝 OpenBSD

當極致的硬體（Pomera 寫作設備）遇上極致的作業系統（OpenBSD），會產生什麼火花？這篇文章紀錄了一次硬體極客的挑戰過程，展示了在特定裝置上實現 Unix 精神的可能性。
- 查看原文
✨ 其他

📐 Not all elementary functions can be expressed with exp-minus-log | 並非所有初等函數都能透過 exp-minus-log 表示

一篇深入探討數學基礎與計算理論的文章。它挑戰了開發者對函數表示形式的直覺認知，討論了數學定義與計算實踐之間的邊界，適合對數學美感與計算科學有興趣的讀者。
- 查看原文
🎵 Rare concert recordings are landing on the Internet Archive | 稀有的演唱會錄音正陸續登陸 Internet Archive

文化保存的數位轉型。成千上萬珍貴且稀有的現場演唱會錄音正被數位化並上傳至 Internet Archive，這對於音樂史的研究與大眾文化遺產的保存具有劃時代的意義。
- 查看原文
📜 A communist Apple II and fourteen years of not knowing what you’re testing | 一台共產主義風格的 Apple II 與長達 14 年的測試迷思

這是一篇充滿技術考古色彩的文章，將早期電腦歷史與測試工程的困惑結合在一起。作者透過獨特的視角，探討了技術在不同時代背景下的演進與誤區。
- 查看原文
🍊 The Orange Pi 6 Plus | Orange Pi 6 Plus 評測

針對單板電腦（SBC）玩家的硬體評測。詳細分析了 Orange Pi 6 Plus 的性能表現與應用場景，是尋找 Raspberry Pi 替代方案者的重要參考資料。
- 查看原文
💡 今日觀點

趨勢總結： 今日的技術動態呈現出一種「新舊交織」的奇妙平衡。我們一方面在追求 AI 的極致效率（如 Claude Code），另一方面卻在修復 20 年前的舊 Bug，並透過數位化手段保存珍貴的歷史錄音。這說明了技術的進步並非單向的拋棄過去，而是不斷在舊有的地基上建立新的智能層。

🚀 給讀者的行動建議：
- 擁抱 AI 協作： 不要只是把 AI 當作搜尋工具，嘗試學習 Claude 等工具的「規律化（Routines）」用法，將其內化為你的開發工作流。
- 警惕依賴風險： 在使用開源套件時，除了關注「能用」，也要思考「如何維護」。避免成為技術生態中的「搭便車者」。
- 關注硬體邊界： 從衛星通訊到單板電腦，硬體層的變革正在重新定義軟體的服務範圍，保持對硬體趨勢的敏銳度。
“`
2026 年 4 月 15 日

作者: tm731531

🚀 科技趨勢日報：從 Apple 領導層更迭到 AI 驅動的系統風險

🤖 AI / 機器學習

Qwen3.6-Max-Preview: 更聰明、更敏銳、持續進化

Anthropic 重新開放 OpenClaw 風格的 Claude CLI 使用權限

Mediator.ai：利用納許均衡與 LLM 系統化公平性

🛠️ 開發工具

一個 Roblox 惡意程式與 AI 工具竟然搞垮了 Vercel 平台

如何製作一個快速的動態語言解釋器

Jujutsu 的大規模合併（Megamerges）實驗

💼 創業 / 商業

John Ternus 即將接任 Apple CEO

🌐 其他

海底電纜是如何維修的？

盆栽風格之美

d100 發明者 Louis Zocchi 逝世

💡 今日觀點

重點摘要

Claude Design 是什麼？三層流程一次看懂

沒用 Claude Design vs 用 Claude Design 的實際差異

實戰案例一：砍功能，省下 3-4 小時重工

砍掉案例 1：背景音樂

砍掉案例 2：獨立話題卡

砍掉案例 3：每日心情打卡

實戰案例二：「可預期」這個原則如何救了 45 條提示語

實戰案例三：Spec 表格讓語氣不漂移

反例：Claude Design 不適合的時候

更重要的反省：Claude Design 是「菜譜」，不是基本功

菜譜出現前、出現後

為什麼 AI 時代這件事特別危險

SDD 真正的基本功是什麼

給讀者的反省題

什麼時候用、什麼時候跳過？判斷決策表

3 個給讀者的實作建議

中華一番案例：AI 結構上做不到的創新

這故事裡有三個 AI 結構上做不到的元素

7 個對抗紹安化的具體做法（可以從下個 task 開始）

1. 先離線想 10 分鐘，再開 AI

2. 刻意加入 AI 絕對不會建議的約束

3. 每週跟一個「四郎」講一次話

4. 把「bug / 意外 / 失敗」當創作材料，不是要避免的事

5. 對 AI 使用「反向問法」

6. 保留一塊「AI 絕不介入」的創作領域

7. 跟 AI 約定「小當家模式」信號詞

優先順序：如果只能選一個開始

結論：不是流程多就好，是流程跟 task 匹配才好

延伸閱讀

重點摘要

Part 1：Memory 系統 — 4.7 改了什麼，對我有什麼用

Claude 4.7 的三個 memory 改進

Cross-session memory 的真相：沒有魔法，只有檔案

自建 Brain 系統 vs Claude 原生 auto-memory

4.7 對自建 Brain 的實際收益

Part 2：Agent Team — Named sub-agent 真正解決什麼

4.7 的四個 Agent Team 改進

Named sub-agent 和 Team A/B/C 的差異

已知限制：teammate 之間不能互喊

Part 3：實戰落地 — Bug 追查框架

為什麼開發和修正要用不同的 agent 拓撲

認真追 bug 的 agent 應該有的樣子

頻道韌性：為什麼要假設「無法中斷」

Skill fallback：沒有 PUA 也要能跑

結案 checklist

為什麼這套設計 model-agnostic

結論

🚀 Hacker News 今日技術趨勢洞察

🤖 AI/機器學習

Claude Token 統計工具：新增模型比較功能 📊

🛠️ 開發工具

Vercel 2026 年 4 月安全事件：雲端平台的安全警訊 ⚠️

Stripe 付款 API 的設計十年回顧 💳

Rust 語言的零拷貝 Protobuf 與 ConnectRPC 實作 🦀

💼 創業/商業

溴元素供應瓶頸：影響記憶晶片生產的地緣政治風險 🧪

🎨 其他

停止試圖用「工程手段」來規避傾聽他人 👂

機械鍵盤聲音博物館 ⌨️

魚露的簡短歷史 🐟

挪威考古新發現：早於維京時代的船葬遺址 🚢

Ben Lerner 的大情緒 📖

Anonymous request-token comparisons from Opus 4.6 and Opus 4.7
（Opus 4.6 與 4.7 的匿名 Request-Token 性能對比）

College instructor turns to typewriters to curb AI-written work
（大學教師重拾打字機，以遏止 AI 代寫作業）

Updating Gun Rocket through 10 years of Unity Engine
（跨越 10 年 Unity 引擎更新：Gun Rocket 的維護歷程）

What are skiplists good for?
（Skip Lists 數據結構有什麼用處？）

Game Devs Explain the Tricks Involved with Letting You Pause a Game
（遊戲開發者揭秘：讓遊戲暫停背後的技術奧秘）

Why Japan has such good railways
（為什麼日本的鐵路系統如此優秀？）

NIST scientists create ‘any wavelength’ lasers
（NIST 科學家研發出「任意波長」雷射）

The electromechanical angle computer inside the B-52 bomber’s star tracker
（B-52 轟炸機星軌追蹤器中的機電式角度計算機）

The becquerel as an SI unit for request rate
（提議將貝克勒爾作為請求率的國際單位）

Metatextual Literacy
（元文本素養）