QA Brain：讓 AI 真的懂你的產品，而不是亂猜

#AI #測試策略 #工具

QA Brain：讓 AI 真的懂你的產品，而不是亂猜目錄 1. AI 給的測試案例為什麼沒用 2. QA Brain 是什麼 3. 五層架構 4. Workflow Skills 5. 防止 AI 腦補 6. 結尾 AI 給的測試案例為什麼沒用用 AI 幫忙想測試案例，第一次試的時候通常有點失望。給 AI 一段需求描述，它會生成一批測試案例——格式整齊、邏輯清楚，但大部分是通用的「正常流程、空值、超長字串」，完全沒有考慮這個產品的歷史 bug、這個模組的邊界邏輯、這個 AC 裡沒寫清楚的隱含規則。Stack Overflow 2024 Developer Survey 顯示，超過 75% 的開發者已在工作中使用 AI 工具；但 Capgemini《World Quality Report 2024 25》同步指出，AI 輔助測試的最大挑戰不是技術整合，而是「如何確保 AI 有足夠的業務知識來生成有意義的測試案例」。原因很簡單：AI 不知道你的產品。你把需求丟給它，它從需求本身推測，但測試案例的價值往往在需求沒有寫的地方——之前踩過的坑、裝置特定行為、活動機制和計時邏輯的交互。這些東西在 AI 腦子裡沒有，就只能猜。 QA Brain 要解決的問題是：讓 AI 有足夠的產品知識，不需要猜。 QA Brain 是什麼 QA Brain 是一個結構化的 QA 知識庫，同時也是 AI 的操作框架。兩個功能： 1. 把分散的 QA 知識整理成有 schema、可驗證的結構 2. 讓 AI 在執行 QA 任務時，能讀到正確的知識層，用對的工作流程完成任務不是把文件塞給 AI 然後問問題，是設計一套架構讓 AI 知道「遇到這個任務，要去哪裡找資料、按什麼流程走」。五層架構 Layer 1 — AGENTS.md 定義 AI 的身份、風格、風險雷達和 typed graph 規則。這是 AI 每次執行任務前都會讀的 constitution——它知道自己是 QA 的角色、知道什麼風險需要特別標記、知道知識庫的關係圖怎麼解讀。 Layer 2 — raw/ 原始來源，唯讀。包含 Notion 匯出、Figma spec、Linear 歷史、會議紀錄、測試報告。這層的規則只有一條：wiki 的結論必須能回溯到 raw 裡的原始資料。AI 做出的判斷如果用到 wiki 知識，要能追溯到這裡，不能憑空斷言。 Layer 3 — wiki/ + WIKI SCHEMA.md 知識層，Karpathy LLM Wiki 概念——把產品知識整理成 AI 容易讀懂的結構：Entity、Module、Topic Map、Bug Pattern。 WIKI SCHEMA.md 定義這層的格式規範和 typed relationship（例如：Module → depends on → Module、BugPattern → found in → Feature）。有 schema 才有辦法驗證，有驗證才能防止知識腐爛。 Layer 4 — skills/qa brain 工作流程層。每個任務對應一個 skill，每個 skill 定義「這個任務需要讀哪些 context、按什麼步驟走」。設計原則：最小必要 context。不是每個任務都把整個 vault 餵給 AI，是根據任務類型選取必要的知識範圍，避免 context 太大反而讓 AI 抓不到重點。 Layer 5 — scripts/ + outputs/ 驗證層。catalog、lint、audit 腳本定期掃描 wiki 的格式是否符合 schema、relationship 是否有懸空指標、知識是否過期。這層的存在是為了防止 AI 腦補——如果 AI 在更新 wiki 的時候寫了一個不符合 schema 的節點，驗證層會抓到。 Workflow Skills 不同的 QA 任務對應不同的 skill，AI 根據任務類型選最小必要 context： | 任務 | Skill | | | | | 搜尋 / 查詢 / 更新 vault | qa brain navigator | | 需求或 AC 模糊 | qa brain requirement grill | | 難重現 bug | qa brain diagnose bug | | Issue 分流 | — | | 覆蓋率稽核 | — | | Bug 智慧分析 | — | | Bug issue review | — | | TC 設計 | — | | 測試情境工作流 | — | | 發版 Gate | — | 以 qa brain requirement grill 為例：AC 描述不清楚的時候，AI 不是直接猜，而是按照這個 skill 定義的流程，先去 wiki 找這個 module 的歷史 bug pattern 和邊界規則，再根據這些知識提出針對性的澄清問題，而不是通用的「請問空值怎麼處理」。 qa brain diagnose bug 在難重現 bug 的場景下，AI 會先查 Device Matrix 確認裝置差異、查 Bug Pattern 看有沒有類似的歷史案例，再提出可能的重現路徑，而不是從零開始猜。防止 AI 腦補這套架構最重要的設計決策是：不信任 AI 的記憶，只信任可驗證的知識。三個機制： RESOLVER.md 決策樹：新增頁面之前，先走決策樹確認放哪個層、哪個分類。不靠「感覺放這裡比較對」，靠規則。 Typed relationship ：wiki 裡的關係都有明確的 type（depends on、found in、tested by），AI 建立新關係時必須聲明 type，驗證工具才能檢查是否合理。唯讀原則：raw 層任何人都不能直接修改（包括 AI）。wiki 的更新要有 raw 層的來源依據，有來源才能追溯，有追溯才能驗證。結尾 AI 輔助 QA 的瓶頸不是 AI 不夠強，是 AI 沒有足夠的產品知識。DORA 2024 的研究指出，文件品質和知識共享是影響軟體交付效能的關鍵因素之一——而 QA Brain 的本質，正是把分散在人腦和歷史記錄裡的 QA 知識，轉化成可讓 AI 讀取、可驗證、可維護的結構化資產。通用 AI 給的測試案例是通用的；有產品 context 的 AI 給的測試案例才是有價值的。QA Brain 做的事是建立這個 context——結構化、可驗證、可維護，讓 AI 有東西可以依賴，而不是每次都從需求文字重新推測。這套架構花了一段時間設計，但一旦建起來，每次新功能的測試案例設計、bug 診斷、覆蓋率稽核都快很多。知識是累積的，架構讓累積有地方去。參考資料 1. Stack Overflow Developer Survey 2024 — AI 工具在開發者工作流程中的採用現況調查 2. Capgemini World Quality Report 2024 25 — AI 輔助測試的挑戰與業界採用趨勢 3. DORA 2024 State of DevOps Report — 文件品質與知識共享對軟體交付效能的影響研究 4. Google Testing Blog — 測試知識體系化與工程文化的實踐參考 5. Ministry of Testing — Articles & Resources — QA 知識管理、工具選型與 AI 輔助測試的社群討論