Kafka 事件流和直接寫資料庫有什麼差別？

走 Kafka 事件流的好處包括：可在 Kafka UI 追蹤完整訊息歷史、失敗自動路由到 task.failed 重試、Consumer 有 Redis + DB 兩層去重、統計 dirty marker 自動觸發、所有來源（channel job / API）走同一套邏輯保持一致性。直接寫 DB 雖然更快，但跳過了這些保障。

JAVA_TOOL_OPTIONS 和 JAVA_OPTS 有什麼不同？

JAVA_TOOL_OPTIONS 是 JDK 標準環境變數，所有 JVM 啟動時都會自動讀取，不需要修改 Dockerfile 的 ENTRYPOINT。JAVA_OPTS 則需要在啟動腳本中明確傳入，如果 Dockerfile 的 ENTRYPOINT 沒有引用它，設定無效。在 Docker 環境中，JAVA_TOOL_OPTIONS 是最小侵入的 JVM 配置方式。

Hibernate ddl-auto: validate 能抓到所有 schema 問題嗎？

不能。ddl-auto: validate 只單向驗證「Entity 中有 mapping 的欄位是否存在於 DB」，不會反向驗證 DB 欄位是否都被 Entity 對應，也不會驗證種子資料 SQL 腳本的正確性。enum 大小寫不一致、種子資料欄位名稱錯誤等問題，只有實際啟動並執行測試才能發現。

Spring Boot 中 @Enumerated(EnumType.STRING) 為何對大小寫敏感？

因為 Hibernate 讀取時呼叫 Java 的 Enum.valueOf()，這個方法要求字串與 enum 常數名稱完全一致（大小寫敏感）。如果資料庫存了 'pending' 但 enum 常數叫 PENDING，讀取時會拋 IllegalArgumentException。解法是確保 DB 的 DEFAULT 值和資料都使用大寫，與 enum 常數名稱一致。

AI 輔助開發工作流如何防止 AI 自動部署到 Production？

Production 部署設計為純手動步驟。Jenkins 只在偵測到 v* tag 時構建鏡像並通知用戶，不會自動執行 helm deploy。用戶需要在本機手動執行 helm upgrade 命令，K8s 才會啟動部署。這確保每次正式上線都有人類判斷。

AI 輔助開發如何確保密碼不進入 Git repo？

三層防護：（1）.gitignore 強制排除 .env、values-prod.yaml 等敏感文件；（2）Jenkins Pipeline 第一個 Stage 執行 gitleaks Secrets 掃描，發現敏感資訊立即中止構建；（3）values-prod.yaml 由用戶自行維護在本機，永遠不提交到 repo。

K8s Secrets 預設安全嗎？

K8s Secrets 預設以 base64 存在 etcd，並非加密。必須明確啟用 encryption at rest（/etc/kubernetes/encryption-config.yaml），或使用 External Secrets Operator 對接 HashiCorp Vault / 雲端 KMS，才能真正保護敏感資訊。

什麼是 Git tag 觸發 Jenkins 的工作流？

用戶創建 staging-v* tag 時，GitHub Webhook 觸發 Jenkins 自動執行 Secrets 掃描、docker build、cosign 簽名、docker push、helm deploy 到 Staging。創建 v* tag 時，Jenkins 只構建鏡像不部署，通知用戶手動 helm deploy 到 Production。

如何防止部署未經授權的 Docker 鏡像到 K8s？

使用 cosign 在 Jenkins Pipeline 中為每個鏡像簽名，並在 K8s 中安裝 Kyverno，設置 ClusterPolicy 要求所有進入 staging 和 production namespace 的 Pod 必須使用通過 cosign 簽名驗證的鏡像，未簽名的鏡像會被準入控制直接拒絕。

標籤: Docker

Spring Boot OMS Code Review 實戰：20 個 Bug 與事件驅動架構的一課

重點摘要

三輪 Code Review 共找出 20+ 個問題，從 NPE 連鎖到種子資料欄位名稱全錯
Kafka Seeder 寫了三個版本，每次重寫都是對「事件驅動架構正確入口」理解的加深
能走事件流就走事件流：API → Kafka → Consumer → DB，每一層都有可追蹤、可重試的意義
21 個 Java 容器沒有 JVM 記憶體限制，用 JAVA_TOOL_OPTIONS 一行解決，不需改 Dockerfile

這是多通路電商 OMS 系統開發過程中的一天工作紀錄。系統整合了 Momo、Shopee、Yahoo 等電商平台，透過 Kafka 事件流處理訂單同步、退貨與統計。今天的目標：完成 feature/stats-pipeline 分支上的所有待辦修復，讓系統能順利 docker compose up，並驗證端對端資料流。

三輪 Code Review：每一輪都有新發現

第一輪：已知清單上的 7 個問題

進入狀態之前就有一份清單，分為 Critical、Warning、Info 三個等級：

等級	問題	修復方式
Critical	OrderUpsertConsumer `.get()` NPE 連鎖	改 `.path()` + 加 orderDataJson null 守衛
Critical	daily_statistics.id 缺 NOT NULL	加約束 + DEFAULT partition
Critical	ReturnUpsertConsumer 未寫 stats dirty marker	新增 Redis ZSET 寫入
Warning	DailyStatisticsService early return 留舊資料	改成刪除過時的 stats 列
Warning	enum 預設值小寫 `'pending'`	改大寫 `'PENDING'`，與 JPA `EnumType.STRING` 對齊
Warning	RetryJobConsumer MissingNode cast	加 `.isObject()` 判斷再 cast

其中 enum 大小寫這個問題值得特別說明。Java 的 @Enumerated(EnumType.STRING) 在讀取時呼叫 Enum.valueOf()，這個方法是 case-sensitive 的。資料庫預設值寫 'pending'，但 enum 常數叫 PENDING，啟動時不會出錯，但一讀到有 DEFAULT 值的列就會拋 IllegalArgumentException。

第二輪：種子資料是另一個地雷區

Schema 修完了，以為大功告成，結果種子資料（02-seed-data.sql）是第二個地雷區：

BCrypt hash 是假的：$2a$10$dummyhashfordevonly... 根本不是有效的 BCrypt hash，Spring Security 的 passwordEncoder.matches() 永遠回傳 false，登入 100% 失敗。
訂單狀態小寫：'completed'、'shipped' — 和上面一樣的 case-sensitive 問題，這次在資料列而不是 DEFAULT 值。
daily_statistics 欄位名稱全錯：用了 order_count、total_amount 這些不存在的欄位名，docker compose up 的 DB 初始化階段會直接 fail。

這些問題的共同特徵是：compile time 抓不到，schema validate 也抓不到。Hibernate 的 ddl-auto: validate 只單向檢查「entity 中有 mapping 的欄位是否存在於 DB」，不會反向驗證 SQL 腳本的正確性。唯一的防護是跑起來測試。

第三輪：21 個容器，一個 JVM 記憶體問題

系統在開發機上跑 21 個 Java 容器（Spring Boot services），沒有任何 JVM heap 限制。JVM ergonomic sizing 預設使用系統 RAM 的 25%，7.4GB 可用 RAM 很快就會不夠。

解法是在 docker-compose.yml 每個服務加 JAVA_TOOL_OPTIONS：

environment:
  JAVA_TOOL_OPTIONS: "-Xmx256m -XX:+ExitOnOutOfMemoryError"

JAVA_TOOL_OPTIONS 是 JDK 標準環境變數，JVM 啟動時自動讀取，不需要修改 Dockerfile 的 ENTRYPOINT。-XX:+ExitOnOutOfMemoryError 讓容器在 OOM 時立刻崩潰（而不是卡死），對 Docker 的 restart: unless-stopped 友好，等於有了自動恢復機制。

Seeder 的三次重寫：對事件驅動架構的理解之旅

今天最有收穫的插曲。目標是「準備一個 Docker 服務，打假訂單資料，確認整體資料流順暢」。這個任務看起來很簡單，結果寫了三個版本。

第一版：直接打 Kafka（被打槍）

第一直覺：用 kafka-python 直接連 kafka:9092，組好 ORDER_UPSERT 訊息送到 order.process topic。快速、直接。

問題：系統對外只有 API，直接操作 Kafka 是繞過了系統設計的邊界。內部基礎設施不應該是外部系統的接入點。

第二版：打 POST /api/orders（沒走事件流）

改用 REST API。先 login 拿 JWT，再 POST /api/orders。

問題：OrderController.createOrder() 是直接寫資料庫，跳過了整個 Kafka pipeline。Stats dirty marker 不會被寫入，DailyStatisticsService 不會被觸發，daily_statistics 表不會更新。雖然訂單進了 DB，但「整體資料流」沒有跑通。

第三版：新增正確的 API 端點（走完整事件流）

在 UserOrderController 新增 POST /api/user/orders，接收訂單資料後發布 ORDER_UPSERT 到 Kafka，回傳 202 Accepted：

POST /api/user/orders  (帶 JWT)
  → 查 Channel → Platform（取得 platformId）
  → 組 ORDER_UPSERT 訊息（header + body + hash）
  → kafkaTemplate.send("order.process", ...)
  → 回傳 202 Accepted

接著：
  Kafka order.process
    → OrderUpsertConsumer（Redis 去重 → INSERT/UPDATE）
        → stats dirty marker 寫入 Redis ZSET
            → StatsRecalcHandler（定時掃）
                → DailyStatisticsService.recalculate()
                    → daily_statistics 更新

端到端，一條不少。

為什麼「能走事件流就走事件流」不只是口號

三次重寫讓這個原則從抽象變得具體。走事件流的好處不只是「解耦」這個詞能涵蓋的：

層面	直接寫 DB	走 Kafka 事件流
可追蹤性	只有 DB record	Kafka UI 可看完整訊息歷史，帶 traceId
錯誤處理	拋 exception，呼叫方看到 500	失敗走 task.failed → retry → task.dlt
去重	需要自己實作	Consumer 有 Redis + DB 兩層去重
統計觸發	需要額外呼叫	Consumer 自動寫 dirty marker，批次計算
一致性	邏輯分散在多處	無論來源（channel job / API），走同一套邏輯

最後一點是最重要的：一致性。不管訂單是從 Shopee channel job 來的，還是透過 API 手動新增的，都走同一個 OrderUpsertConsumer，同一套去重邏輯，同一套 stats pipeline。系統裡沒有「繞過」的快捷路徑。

今日修改摘要

檔案	類型	說明
01-schema.sql	Bug Fix	NOT NULL、DEFAULT partition、enum 大小寫
02-seed-data.sql	Bug Fix	BCrypt hash、訂單狀態大小寫、daily_statistics 欄位名稱
OrderUpsertConsumer	Bug Fix	`.get()` → `.path()`，移除 unused import
ReturnUpsertConsumer	Bug Fix	加 stats dirty marker、移除 unused import
DailyStatisticsService	Bug Fix	early return 時刪除過時 stats 列
OrderService	Bug Fix	NOT NULL 欄位的 null 守衛
docker-compose.yml	Infra	所有 21 個 Java 容器加 JAVA_TOOL_OPTIONS
UserOrderController	Feature	新增 POST /api/user/orders → Kafka pipeline
docker/test-data-generator/	Feature	Python seeder，透過 API 打假訂單

結語：追蹤路徑比結果更重要

今天花最多時間的不是寫 code，而是「把對的事情弄清楚」。Seeder 寫了三個版本，不是因為技術難，而是因為對系統的理解在逐漸深化。

一個好的事件驅動系統，它的「正確入口」只有一個。找到那個入口，比快速把功能做出來更重要。這條原則同樣適用於大系統的任何角落：追蹤路徑比結果更重要，因為你下次出問題的時候，你需要知道訊息從哪裡來、往哪裡去。

能走事件流就走事件流。能用快取盡量快取。這不是教條，是讓大系統在出問題時還能被追蹤、被診斷、被修復的保險。

2026 年 3 月 27 日

AI 輔助開發 CI/CD 工作流：Jenkins、K8s、ISO 27001 完整設計

重點摘要

AI 只負責寫 code、提 PR，不碰版本決策和 Production 部署，人類保留最終控制權
透過 Git tag 觸發 Jenkins，Staging 全自動部署、Production 手動 helm 執行，兩階段驗證才上線
敏感資訊三層隔離：.gitignore → K8s Secrets → etcd 加密，密碼永遠不進 repo
補齊 RBAC、Audit Log、鏡像簽名、Secrets Scan 四大安全缺口，達到 ISO 27001 合規

AI 輔助開發越來越普遍，但大多數團隊面臨同一個問題：AI 寫的 code 要怎麼安全地上線？ 誰決定部署時機？密碼怎麼管？如果 AI 出錯了，有什麼防護網？

本篇文章完整說明 ONEEC OMS 系統實際採用的 AI 協作工作流設計，包含完整的 User Story、Jenkins Pipeline 架構、三環境部署策略，以及通過安全審查後補齊的 RBAC、Audit Log、鏡像簽名等安全強化配置。

核心設計理念：人類掌控節奏，AI 加速執行

這套工作流的核心原則只有一句話：AI 是高效能的執行者，不是決策者。具體體現在以下四點：

AI 負責：寫 code、建 Dockerfile、提 PR、提供 Jenkins script 和 Helm chart
用戶負責：code review、創建 git tag（決定版本和部署時機）、手動 helm 部署到 Production
運維負責：管理 K8s Secrets、設定 Jenkins credentials、維護集群
敏感資訊：密碼、API Key、SSL 憑證永遠不進入 Git repo

完整 User Story：從需求到上線的 10 個步驟

以下用一個真實場景說明整個流程：場景：優化訂單 API 的查詢效能。

Step 1：AI 開發（feature branch）

AI 從 dev 分支切出 feature branch，完成開發後推送 PR：

# AI 執行
git checkout dev && git pull origin dev
git checkout -b feature/order-api-optimize

# 編寫程式碼...

# 本地驗證
docker-compose up -d
curl http://localhost:8080/api/orders?status=pending
# ✅ 回傳正確，效能提升 30%

# 提交並推送
git add . && git commit -m "feat(order-api): optimize query performance"
git push origin feature/order-api-optimize
# 建立 PR → dev

Step 2：用戶 Code Review & Merge

用戶在 GitHub UI 審查 PR：確認邏輯正確、有測試覆蓋、無敏感資訊後 approve 並 merge 到 dev。此時沒有任何自動化觸發，代碼靜靜等待部署決策。

Step 3：用戶創建 Staging Tag → Jenkins 自動觸發

用戶決定要部署到測試環境時，創建一個 staging-v* tag：

# 用戶執行
git tag staging-v1.0.1
git push origin staging-v1.0.1

# GitHub Webhook → Jenkins 自動執行：
# ├─ Secrets 掃描（gitleaks）
# ├─ docker build（所有 pods）
# ├─ cosign 簽名鏡像
# ├─ docker push to registry
# ├─ helm deploy to Staging K8s（使用 values-staging.yaml）
# └─ 通知用戶：Staging v1.0.1 is live

Step 4：用戶在 Staging 驗證

kubectl get pods -n staging
curl https://staging-api.example.com/api/orders?status=pending
# ✅ 功能正常，效能優化生效
# ✅ 錯誤率 0%
# ✅ 回應時間 < 100ms

Step 5：用戶創建 Production Tag → Jenkins 構建正式鏡像

# 用戶執行（確認 Staging 無誤後）
git tag v1.0.1
git push origin v1.0.1

# Jenkins 執行：
# ├─ Secrets 掃描
# ├─ docker build（所有 pods，tag 改為 v1.0.1）
# ├─ cosign 簽名鏡像
# ├─ docker push to registry
# ├─ 生成 Helm values（不含敏感資訊）
# └─ 通知用戶：Images ready, run helm command

Step 6：用戶手動部署到 Production

Production 部署是整個流程中唯一純手動的步驟，這是刻意設計的——確保每一次正式上線都有人類判斷：

# 用戶在本機執行
helm upgrade --install order-api \
  /path/to/your/prod-configs/order-api/values-prod.yaml \
  --set image.tag=v1.0.1 \
  -n production

# K8s 自動從 Secrets 注入密碼、API Key
# Kyverno 自動驗證鏡像簽名（未簽名直接拒絕）
# Deployment 完成 ✅

Step 7：監控確認上線成功

kubectl get pods -n production
curl https://api.example.com/api/orders?status=pending
# ✅ 正式環境驗證通過，上線成功

三個部署環境的定義與分工

環境	用途	部署方式	配置來源	觸發者
Dev	本地開發驗證	docker-compose up	.env.dev	AI（開發時）
Staging	測試環境（K8s）	Jenkins 自動部署	values-staging.yaml（在 repo）	用戶（tag 觸發）
Production	正式環境（K8s）	手動 helm 部署	values-prod.yaml（用戶維護）+ K8s Secrets	用戶（手動執行）

Jenkins Pipeline 完整架構

Jenkins Pipeline 由 GitHub Webhook（tag push）觸發，整個流程分為 6 個 Stage：

Stage 0：Secrets 掃描（安全門控）

這是整個 Pipeline 的第一道防線，也是最重要的安全門控。使用 gitleaks 掃描 repo 中是否含有密碼、API Key 等敏感資訊，發現即中止構建並通知安全告警。

stage('Secrets Scan') {
    steps {
        sh '''
            gitleaks detect \
              --source . \
              --config .gitleaks.toml \
              --exit-code 1 \
              --report-format json \
              --report-path gitleaks-report.json
        '''
    }
    post {
        failure {
            sh 'sh scripts/notify-security-alert.sh ${TAG_NAME} gitleaks-report.json'
            error('❌ Secrets 掃描發現敏感資訊，構建中止！')
        }
    }
}

Stage 1：Tag 偵測（決定部署目標）

根據 tag 名稱判斷本次構建的部署目標：

stage('Detect Tag') {
    steps {
        script {
            if (env.TAG_NAME =~ /^staging-v.*/) {
                env.DEPLOYMENT_ENV = 'staging'
            } else if (env.TAG_NAME =~ /^v.*/) {
                env.DEPLOYMENT_ENV = 'production'
            } else {
                error("❌ 未知 tag 格式: ${env.TAG_NAME}")
            }
        }
    }
}

Stage 2：Build Images

構建所有 Pod 的 Docker 鏡像。鏡像本身不含任何配置、密碼、API Key，這是配置與代碼分離的核心原則：

#!/bin/bash
# scripts/build-docker.sh
TAG=$1

docker build -t registry.example.com/order-api:${TAG} ./simpleec-api
docker build -t registry.example.com/user-app:${TAG} ./user-app
docker build -t registry.example.com/channel-job:${TAG} ./simpleec-channel-job
# ... 所有 pods

Stage 3：Sign Images（供應鏈安全）

使用 cosign 為每個鏡像簽名，確保 Production 只能部署來自 Jenkins 的受信任鏡像：

stage('Sign Images') {
    steps {
        withCredentials([file(credentialsId: 'cosign-private-key', variable: 'COSIGN_KEY')]) {
            sh 'sh scripts/sign-docker.sh ${TAG_NAME} ${COSIGN_KEY}'
        }
    }
}

# scripts/sign-docker.sh
for IMAGE in "${IMAGES[@]}"; do
    cosign sign --key "${COSIGN_KEY}" \
      --tlog-upload=false \
      "${IMAGE}"
done

Stage 4：Push Images

推送到 Docker Registry。Registry 啟用 Immutable Tags，同一個 tag 無法被覆蓋，確保版本不可篡改：

stage('Push Images') {
    steps {
        withCredentials([usernamePassword(
            credentialsId: 'docker-registry-creds',
            usernameVariable: 'REGISTRY_USER',
            passwordVariable: 'REGISTRY_PASS'
        )]) {
            sh 'sh scripts/push-docker.sh ${TAG_NAME}'
        }
    }
}

Stage 5a（Staging）：自動部署到 Staging K8s

stage('Deploy to Staging') {
    when { expression { env.DEPLOYMENT_ENV == 'staging' } }
    steps {
        withCredentials([file(credentialsId: 'kubeconfig-staging', variable: 'KUBECONFIG')]) {
            sh '''
                helm upgrade --install order-api ./k8s/helm/order-api \
                  --values ./k8s/helm/order-api/values-staging.yaml \
                  --set image.tag=${TAG_NAME} \
                  -n staging
            '''
        }
    }
}

Stage 5b（Production）：生成 Helm Values，通知用戶手動部署

對於 Production tag，Jenkins 不自動部署，而是生成配置檔並通知用戶手動執行：

stage('Generate Helm Values') {
    when { expression { env.DEPLOYMENT_ENV == 'production' } }
    steps {
        sh 'sh scripts/generate-helm-values.sh ${TAG_NAME}'
        // 生成 values-v${TAG_NAME}.yaml（不含敏感資訊）
        // 通知用戶：Images ready, run helm command
    }
}

Helm 配置隔離：敏感資訊三層防護

配置分為三層，層層隔離：

第一層：values-staging.yaml（在 repo，測試配置）

# 主機名用占位符，從 Jenkins 環境變數注入，不硬編碼內網地址
env:
  DATABASE_HOST: "${POSTGRES_STAGING_HOST}"
  DATABASE_NAME: simpleec_test
  REDIS_HOST: "${REDIS_STAGING_HOST}"
  API_LOG_LEVEL: DEBUG

第二層：values-prod.yaml（用戶本機維護，不進 repo）

# 用戶的私密文件，只在本機
env:
  DATABASE_HOST: postgres-prod.example.com
  API_LOG_LEVEL: WARN
  # ⚠️ 資料庫密碼不在這裡！從 K8s Secrets 注入

envFrom:
  - secretRef:
      name: database-prod-creds  # K8s Secret（運維管理）
  - secretRef:
      name: api-keys-prod        # K8s Secret（運維管理）

第三層：K8s Secrets + etcd 加密

# 運維在 Production K8s 上創建
kubectl create secret generic database-prod-creds \
  --from-literal=username=prod_user \
  --from-literal=password=<secure-password> \
  -n production

# K8s 預設 Secrets 以 base64 存在 etcd（並非加密！）
# 必須啟用 encryption at rest
# /etc/kubernetes/encryption-config.yaml
apiVersion: apiserver.config.k8s.io/v1
kind: EncryptionConfiguration
resources:
  - resources: ["secrets"]
    providers:
      - aescbc:
          keys:
            - name: key1
              secret: <base64-encoded-32-byte-key>

安全強化：補齊四大缺口

原始設計經過安全審查後，發現四個必須在投產前補足的缺口：

缺口一：K8s RBAC 未定義

三個角色各有最小權限（文件放在 k8s/rbac/）：

角色	允許操作	明確禁止
Jenkins SA（staging）	update/patch Deployments, get Pods	讀取任何 Secrets
用戶（production）	helm 部署相關資源	讀取業務 Secrets（DB 密碼、API Key）
運維（production）	Secrets 完整管理權	–

# 驗證 Jenkins SA 無法讀取 Secrets（應輸出 no）
kubectl auth can-i get secrets \
  --as=system:serviceaccount:staging:jenkins-deployer \
  -n staging

缺口二：K8s Audit Log 未配置

ISO 27001 A.12.4.1 要求所有敏感操作都要有日誌。以下 Audit Policy 至少記錄 Secrets 訪問和 Deployment 變更：

# /etc/kubernetes/audit-policy.yaml
apiVersion: audit.k8s.io/v1
kind: Policy
rules:
  - level: Metadata
    resources:
      - group: ""
        resources: ["secrets"]  # 所有 Secrets 訪問都記錄

  - level: Request
    verbs: ["create", "update", "delete", "patch"]
    resources:
      - group: "apps"
        resources: ["deployments"]

  - level: None
    users: ["system:kube-proxy"]
    verbs: ["watch", "list"]

缺口三：鏡像簽名驗證（Kyverno 準入控制）

確保集群只能部署來自 Jenkins 簽名的鏡像，防止鏡像替換攻擊：

apiVersion: kyverno.io/v1
kind: ClusterPolicy
metadata:
  name: verify-image-signatures
spec:
  validationFailureAction: Enforce  # 未簽名鏡像直接拒絕
  rules:
    - name: check-image-signature
      match:
        any:
          - resources:
              kinds: ["Pod"]
              namespaces: ["staging", "production"]
      verifyImages:
        - imageReferences:
            - "registry.example.com/*"
          attestors:
            - count: 1
              entries:
                - keys:
                    publicKeys: |-
                      -----BEGIN PUBLIC KEY-----
                      # cosign.pub 內容
                      -----END PUBLIC KEY-----

缺口四：GitHub Branch Protection 口頭約定 → 技術強制

分支	Required Reviews	CI 必須通過	Push 限制
main	2 人 approve	✅ jenkins-build + secrets-scan	僅 team-lead
staging	1 人 approve	✅ jenkins-build + secrets-scan	僅 team-lead
dev	1 人 approve	–	必須透過 PR（AI 不能直接 push）

Git 分支策略與 Tag 命名規範

整個工作流的分支拓撲如下：

main                     # Production 對應，受嚴格保護
 └─ tag: v1.0.0, v1.0.1  # 觸發 Jenkins 構建 Production 鏡像

staging                  # 測試環境，中度保護
 └─ tag: staging-v1.0.0  # 觸發 Jenkins 自動部署到 Staging K8s

dev                      # 開發積累，AI 透過 PR 提交
 └─ 來源：feature/* 合入

feature/*                # AI 的工作分支（每個功能一個）
 ├─ feature/user-auth
 ├─ feature/order-api
 └─ feature/channel-job-momo

敏感資訊完整隔離架構

存放位置	可以存什麼	絕對不能存什麼	管理者
Git Repository	代碼、Dockerfile、values-staging.yaml、Helm chart 模板	密碼、API Key、SSL 憑證、values-prod.yaml	AI + 用戶
Docker Registry	不含配置的乾淨鏡像（cosign 簽名）	任何敏感資訊	Jenkins（push）
K8s Secrets（etcd 加密）	database-prod-creds、api-keys-prod、SSL 憑證	–	運維
Jenkins Credentials	GitHub token、Registry credentials、cosign key、kubeconfig	–	運維

回滾策略

Staging 環境回滾

# 快速回滾到上一個版本
helm rollback order-api 0 -n staging

# 或指定版本
helm upgrade order-api ./k8s/helm/order-api \
  --values ./k8s/helm/order-api/values-staging.yaml \
  --set image.tag=staging-v1.0.0 \
  -n staging

Production 環境回滾

# 查看部署歷史
helm history order-api -n production

# 回滾到上一個版本
helm rollback order-api 0 -n production

# 所有 tag 在 Git 可追溯
git log --oneline --all | grep "v1.0"

投產前安全檢查清單

在正式上線前，以下所有項目必須確認通過：

代碼倉庫安全

✅ .gitignore 包含 .env, .env.dev, **/values-prod.yaml
✅ repo 根目錄存在 .gitleaks.toml 配置文件
✅ pre-commit hook 已安裝
✅ git log –all — ‘*.env’ 確認歷史中無敏感文件

Jenkins Pipeline

✅ 第一個 Stage 為 Secrets Scan（gitleaks）
✅ Sign Images Stage 已配置（cosign）
✅ Push Images 使用 Jenkins Credentials（非明文）
✅ GitHub Webhook Secret 已配置（Jenkins + GitHub 雙端）

K8s 訪問控制

✅ k8s/rbac/ 三個 RBAC 文件已 apply
✅ Jenkins SA 驗證：kubectl auth can-i get secrets … → no
✅ Kyverno 已安裝，鏡像簽名驗證策略已 apply
✅ etcd encryption at rest 已啟用（運維確認）

審計和監控

✅ K8s Audit Log 已配置（audit-policy.yaml）
✅ Audit Log 保留策略 ≥ 90 天
✅ 告警規則已配置（部署失敗、Secrets 掃描失敗）

總結：這套工作流解決了什麼問題？

AI 輔助開發的核心挑戰不是技術，而是信任邊界：誰能做什麼？誰為每個決定負責？這套工作流的答案很清楚：

AI 的邊界：寫 code、提 PR、建 Docker image — 技術執行層
用戶的邊界：review 代碼、創建 tag、手動部署 Production — 決策層
運維的邊界：管理 Secrets、維護集群、配置 credentials — 基礎設施層
自動化的邊界：Jenkins 在 tag 觸發後執行既定腳本 — 不越界，不決策

這種分層設計讓 AI 協作既高效又安全，每一個部署都有完整的審計軌跡，每一個敏感操作都需要人類授權。

2026 年 3 月 21 日

Elasticsearch 研究筆記：從 Solr Edismax 到 NEST 實戰

研究目標

Elastic 能否做到 Solr 的 Edismax
達到的情境：根據 List 的算法跟 String 算法是否一致
權重的分布情況

Docker 單節點運行指令

docker run -d --name elasticsearch -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" -e "xpack.security.enabled=false" -v es_data:/usr/share/elasticsearch/data elasticsearch:8.17.0

Docker 集群配置 (docker-compose)

version: '3'
services:
  elasticsearch-node1:
    image: docker.elastic.co/elasticsearch/elasticsearch:8.17.0
    environment:
      - discovery.type=zen-disco
      - discovery.seed_hosts=elasticsearch-node1,elasticsearch-node2,elasticsearch-node3
      - cluster.initial_master_nodes=elasticsearch-node1,elasticsearch-node2,elasticsearch-node3
      - xpack.security.enabled=false
    volumes:
      - es_data1:/usr/share/elasticsearch/data
    networks:
      - elasticsearch-net
    ports:
      - "9200:9200"
      - "9300:9300"

  elasticsearch-node2:
    image: docker.elastic.co/elasticsearch/elasticsearch:8.17.0
    environment:
      - discovery.type=zen-disco
      - discovery.seed_hosts=elasticsearch-node1,elasticsearch-node2,elasticsearch-node3
      - cluster.initial_master_nodes=elasticsearch-node1,elasticsearch-node2,elasticsearch-node3
      - xpack.security.enabled=false
    volumes:
      - es_data2:/usr/share/elasticsearch/data
    networks:
      - elasticsearch-net
    ports:
      - "9201:9200"
      - "9301:9300"

  elasticsearch-node3:
    image: docker.elastic.co/elasticsearch/elasticsearch:8.17.0
    environment:
      - discovery.type=zen-disco
      - discovery.seed_hosts=elasticsearch-node1,elasticsearch-node2,elasticsearch-node3
      - cluster.initial_master_nodes=elasticsearch-node1,elasticsearch-node2,elasticsearch-node3
      - xpack.security.enabled=false
    volumes:
      - es_data3:/usr/share/elasticsearch/data
    networks:
      - elasticsearch-net
    ports:
      - "9202:9200"
      - "9302:9300"

networks:
  elasticsearch-net:
    driver: bridge

volumes:
  es_data1:
  es_data2:
  es_data3:

啟動集群：

(閱讀全文…)

2026 年 2 月 24 日

爬蟲機(OnGCP)

總結

需要做的事情
1. GCP帳號
2. 開VM
3. 多台VM 指定一台為母機
4. 其餘為子機
5. 安裝DOCKER 並在子母機上設定關聯

(閱讀全文…)

2026 年 2 月 24 日

標籤: Docker

Spring Boot OMS Code Review 實戰：20 個 Bug 與事件驅動架構的一課

重點摘要

三輪 Code Review：每一輪都有新發現

第一輪：已知清單上的 7 個問題

第二輪：種子資料是另一個地雷區

第三輪：21 個容器，一個 JVM 記憶體問題

Seeder 的三次重寫：對事件驅動架構的理解之旅

第一版：直接打 Kafka（被打槍）

第二版：打 POST /api/orders（沒走事件流）

第三版：新增正確的 API 端點（走完整事件流）

為什麼「能走事件流就走事件流」不只是口號

今日修改摘要

結語：追蹤路徑比結果更重要

AI 輔助開發 CI/CD 工作流：Jenkins、K8s、ISO 27001 完整設計

重點摘要

核心設計理念：人類掌控節奏，AI 加速執行

完整 User Story：從需求到上線的 10 個步驟

Step 1：AI 開發（feature branch）

Step 2：用戶 Code Review & Merge

Step 3：用戶創建 Staging Tag → Jenkins 自動觸發

Step 4：用戶在 Staging 驗證

Step 5：用戶創建 Production Tag → Jenkins 構建正式鏡像

Step 6：用戶手動部署到 Production

Step 7：監控確認上線成功

三個部署環境的定義與分工

Jenkins Pipeline 完整架構

Stage 0：Secrets 掃描（安全門控）

Stage 1：Tag 偵測（決定部署目標）

Stage 2：Build Images

Stage 3：Sign Images（供應鏈安全）

Stage 4：Push Images

Stage 5a（Staging）：自動部署到 Staging K8s

Stage 5b（Production）：生成 Helm Values，通知用戶手動部署

Helm 配置隔離：敏感資訊三層防護

第一層：values-staging.yaml（在 repo，測試配置）

第二層：values-prod.yaml（用戶本機維護，不進 repo）

第三層：K8s Secrets + etcd 加密

安全強化：補齊四大缺口

缺口一：K8s RBAC 未定義

缺口二：K8s Audit Log 未配置

缺口三：鏡像簽名驗證（Kyverno 準入控制）

缺口四：GitHub Branch Protection 口頭約定 → 技術強制

Git 分支策略與 Tag 命名規範

敏感資訊完整隔離架構

回滾策略

Staging 環境回滾

Production 環境回滾

投產前安全檢查清單

代碼倉庫安全

Jenkins Pipeline

K8s 訪問控制

審計和監控

總結：這套工作流解決了什麼問題？

Elasticsearch 研究筆記：從 Solr Edismax 到 NEST 實戰

研究目標

Docker 單節點運行指令

Docker 集群配置 (docker-compose)

爬蟲機(OnGCP)

總結