AI 不是答案販賣機:企業導入人機協作的實戰心法

重點摘要(TL;DR)
  • 企業 AI 導入失敗,多半敗在把 AI 當成「問一句答一句」的 GPT 答案販賣機,而不是目標導向的人機協作:AI 供廣度與最新,人做判斷與收斂。
  • 差別在用法的 pattern,不在工具廠牌。同一個模型,用錯 pattern 就廢、用對就強。
  • 讓組織接受 AI,要種子優先:讓最被信服的領域師傅先贏一場,而且把 AI 定位成「放大他的判斷」,不是取代他。
  • 「問 AI 會不會拿我的資料去訓練?」要分兩層:機制上問(inference)≠ 訓練(training);政策上平台會不會留存是另一回事,所以敏感資料控制資料流。
  • 自己微調一個模型?先撞規模牆:小模型光參數就 7B、你連 7B 筆資料都沒有、堪用的要 70B 以上——多數團隊玩不起。

企業 AI 導入這件事,真正難的從來不是技術 demo,而是怎麼讓一整個組織把 AI 用對。多數人腦袋裡的 AI,是 ChatGPT 那種「問一句、拿一個答案、結束」的答案販賣機;但實際有產值的人機協作,是另一回事。這篇把我在推動企業 AI 落地時整理出來的一套心法寫下來:從「pattern 不是工具」的觀念、怎麼用種子師傅落地,到幫傳統資料/系統背景的人釐清 LLM 到底是什麼。

AI 不是「答案販賣機」:兩種用法的 pattern

大家誤解的 AI 用法,是把它當成一個「知道答案的人」:問得模糊、答得模糊,答錯就下結論「AI 不準」。這是單回合的答案販賣機 pattern。真正會用的人,跑的是目標導向協作 pattern:帶一個可驗證的目標進去,AI 生一版,人用判斷砍掉一半、再問、再收斂。AI 答錯不是 AI 沒用,是還沒被你的判斷收斂。

❌ 答案販賣機 pattern(錯誤用法) ✅ 目標導向協作 pattern(用好的方式)
單回合:問一句、拿一個答案、結束 多回合:不斷整理、收斂
把 AI 當「知道答案的人」,答錯就放棄 AI 是材料供應商,不是答案
問得模糊 → 答得模糊 → 結論「AI 不準」 人帶可驗證的目標來,才收斂得出東西

差別在 pattern,不在工具廠牌

這裡要特別澄清一件常被誤導的事:這不是「GPT 不行、某某工具才行」的工具戰。OpenAI 的模型一樣能跑 harness、跑 agent;Claude、Gemini 也是。重點是你用哪一種 pattern——同一個工具,用答案販賣機 pattern 就廢,用目標導向協作 pattern 就強。把焦點放在「怎麼用好」,而不是「押哪個廠牌」,這是企業導入時最該先校正的心態。想看協作底層怎麼串(Loop、Harness、MCP、A2A),可以參考〈一張圖看懂 AI Agent 系統〉。

人機協作的分工:AI 供廣度,人做判斷

協作的核心是分工:AI 負責廣度與最新,人負責判斷與商務收斂。舉兩個真實情境——我本身不懂 ESG 領域,但能產出可用的 ESG 內容,靠的不是「AI 很強」,而是「業務判斷 × AI 廣度」,主角是人。

領域 AI 帶來 人(領域師傅)帶來
ESG 最新法規、國際框架、同業做法 哪條跟自家業務有關、哪條是噪音、收斂到什麼決策
HR 入職流程 同業最佳實務、欄位該收什麼 真實痛點、敏感資料邊界、主管要看什麼

這張分工表還有一個關鍵作用:它把人的角色從「會被取代」翻成「不可取代的那一端」。答案要靠人的業務判斷才能收斂——這正是降低抗拒的鑰匙。

怎麼讓組織接受 AI?種子優先,別碰師傅的逆鱗

一個在「瞎忙、光追上就累」的組織,無法大爆炸式導入。務實的做法是種子優先、由上而下:挑最被信服(不是最資深、也不是去攻克最抗拒)的領域師傅,給他一場掛在他名下的勝利——讓他因為用了 AI 而更神,功勞歸他。一個受敬重的師傅公開贏一場,勝過十場培訓。關於為什麼多數企業 AI 落地會失敗,我在〈數位轉型不是換系統〉講得更細。

而領域師傅最怕的是「你把我腦袋數位化完,就不需要我了」。破解法是把角色講清楚:AI 當 Generator、師傅當 Verifier——AI 先生一版,師傅一眼看出哪裡外行、打回去重做,他永遠是「說了算」的裁判。AI 結構上做不到的那塊(意外、跨領域、個人經驗、把失敗翻成靈感)永遠是人的。結果是:重複的 AI 做(工作輕鬆化)× 判斷被放大(價值最大化)。AI 是把師傅的判斷裝上擴音器,不是把師傅關進系統。

導入成功怎麼衡量?
不是「多少人學會了 SOP / prompt 範本」(那只是換了個更花俏的搜尋引擎),而是「多少師傅開始帶自己的目標來,而且會推翻 AI 的答案」——那才是真的在駕駛,換腦成功。

「AI 會拿我的問題去訓練嗎?」那是上個時代的恐懼

資料/資安背景的人最大的恐懼是:「我問 AI 公司機密,它是不是學起來、洩給對手?」這要分兩層講清楚,別混在一起。

  • 機制層:你問 AI,就像問一個有學問的人「從腦子裡想個答案」——他當下不會把你的問題拿去重練腦袋。你問的時候模型參數是凍結的,你的話只進「當下對話記憶(context)」,不進模型本體。問(inference)≠ 訓練(training)
  • 規模層:頂尖模型有海量公開語料 + 大量 AI 自己產的合成資料可用,根本不缺你那一筆。一筆查詢對十億級參數的模型,既不需要、也沒有統計意義。
  • 政策層:平台會不會「留存」你的對話、日後再拿去訓練,是另一回事——這層不能盡信「我們不訓練」的承諾。

所以真正穩的做法,不是賭平台的承諾,而是控制資料流:哪些資料只在地端餵、哪些可上雲,是可控的切分。把「機制上的安全」跟「政策上的信任」分開,團隊就不會再被這個恐懼卡住。延伸閱讀:〈當 AI 夠重要,價值與風險就是一體兩面〉。

那「自己微調一個模型」呢?先撞上規模這道牆

有一種進階方法叫微調(fine-tune):拿你的數據去調模型的細部參數,讓通用模型變專精。聽起來很美,但對多數團隊,先撞上的是「規模」這道牆。

這道牆 現實
參數規模 常見的「小」模型,光參數就 7B(70 億)起跳;訓練它用的資料更是兆級 token,遠超參數量。
你的資料量 你連 7B 筆自有資料都沒有;整個公司的資料庫,跟大廠訓練量比是一滴水。
品質取捨 跑得動的 7B 通用能力不堪用,堪用的要 70B 以上、你又跑不動——兩頭都不划算。
機器與數據門檻 GPU 叢集養不養得起、資料夠不夠乾淨、能不能驗證它調對了沒。

務實結論:先把 prompt + 檢索(RAG)用好;真要微調,只在「單一窄任務 + 算過成本」時才考慮。模型的價值,正來自一個你複製不了的數據規模——理性的路不是「自己訓一個」,是「把這顆已吃過全世界資料的通用模型,指揮好」。雲端 vs 本地、訂閱 vs API 怎麼選,可以看〈Claude 分流實戰〉。

LLM 是什麼?它是你會的 ML 養大的那一隻

很多資料/系統背景的人看不懂 LLM,不是學不會,是太熟舊地圖。但要強調:這不是「新打敗舊」。你會的 ML——用大量數據訓練出一個數學模型來預測——正是 LLM 的根。LLM 就是把這件事推到極大:超大數據 + GPU 暴力算力,養出一個「通用」的數學模型。你懂 ML,你就懂 LLM 的根;它不是要你丟掉所學,是你那條線長大的盡頭。

真正變的,是用法:

你熟的做法 現在的做法 講白話
每個任務,拿你的數據訓練一個專用模型 有一個出廠就通用的大模型,用「講人話」當場指揮 從訓練變指揮
介面:寫 SQL / 程式 介面:寫自然語言(prompt) 從寫程式變講需求
你的資料 = 拿去訓練 你的資料 = 當場貼給它參考(context)或檢索(RAG) 給它看,不是被它吞

順帶釐清 tokenmodel 在架構的位置:model 是「會思考的通用算力」(不是資料庫),可分等級——便宜快的小模型 vs 貴而強的大模型,按任務取捨;token 是它的「水電表」,你輸入多長、它輸出多長,就用掉多少,帳就這樣算。

一句話心法

企業 AI 導入,不是換一個更聰明的搜尋引擎,是換一種工作分工:人守住判斷與目標,AI 負責生產與廣度,驗證用對抗。把焦點放在 pattern,不押工具;讓師傅當裁判,不是被取代;敏感資料控制資料流,不賭承諾。這三件做對,AI 才真的落得了地。

延伸閱讀:〈傳產與金融怎麼把 AI 落地?三個真實場景〉、〈跟 AI 寫程式的 15 條軟工紀律〉。

留言

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *