Data & Knowledge 基礎
讓行銷人理解「怎樣整理資料才讓 AI 好用」
為什麼行銷人需要懂資料?
你可能會想:「我是做行銷的,資料整理不是 IT 的事嗎?」
事實是,AI 工具的產出品質,有 80% 取決於你餵給它的資料品質。如果你希望 AI 幫你寫出精準的商品文案、分析顧客輪廓、或預測下一季的熱銷品,你必須先懂得怎麼「整理」你手上的資料。
這堂課會用你每天都在接觸的行銷情境,帶你搞懂資料的基本分類和品質觀念。
一、結構化 vs 非結構化資料
結構化資料:有固定欄位、可以排列的資料
想像你的 Excel 銷售報表:
| 日期 | 產品名稱 | SKU | 通路 | 銷售數量 | 營收 |
|---|---|---|---|---|---|
| 2026-03-01 | 玻尿酸精華液 30ml | SB-HA-030 | 官網 | 152 | 68,400 |
| 2026-03-01 | 膠原蛋白面膜 5入 | SB-CL-005 | momo | 89 | 35,600 |
這就是結構化資料。每一筆資料都有固定的欄位,可以排序、篩選、計算。
行銷場景中常見的結構化資料:
- 銷售報表(日期、品項、數量、金額)
- 會員資料(姓名、年齡、消費金額、購買頻率)
- 廣告成效數據(曝光、點擊、轉換、ROAS)
- 庫存數據(SKU、數量、到期日)
非結構化資料:沒有固定格式的資料
再想像你的客戶在 IG 留言:
「這款精華液真的超好用!擦完隔天皮膚亮一個色號,回購第三罐了 ❤️」
「包裝很美但用起來有點黏,夏天可能不太適合…」
這就是非結構化資料。它是自由文字、沒有固定格式,但裡面藏著超有價值的資訊。
行銷場景中常見的非結構化資料:
- 客戶評論和留言
- 客服對話記錄
- 品牌社群貼文
- 產品說明書和 SOP 文件
- 會議記錄和內部溝通紀錄
為什麼這個分類很重要?
因為 AI 處理這兩種資料的方式完全不同:
| 結構化資料 | 非結構化資料 | |
|---|---|---|
| AI 怎麼用 | 數據分析、預測、報表 | 文字理解、情感分析、摘要 |
| 整理重點 | 欄位一致、格式統一 | 分類標記、去除雜訊 |
| 常見問題 | 缺值、格式不一、欄位命名混亂 | 資訊散落各處、沒有系統化歸檔 |
二、Metadata 和標籤的重要性
什麼是 Metadata?
Metadata 就是「描述資料的資料」。聽起來很繞口,但其實你每天都在用。
舉例:你在電腦裡存了一張產品圖,檔案名稱叫 IMG_20260315.jpg。這個檔名只告訴你拍攝日期,但如果你改成 玻尿酸精華液_30ml_官網主圖_2026Q1.jpg,你馬上就知道這是什麼、用在哪裡、屬於哪個時期。
後面那串額外資訊,就是 Metadata。
行銷場景的 Metadata 實例
產品分類 Metadata:
產品名稱:玻尿酸精華液 30ml
品牌:[你的品牌名]
品類:精華液
功效標籤:保濕、亮白
適用膚質:乾性、混合性
價格帶:中高價($400-$600)
上市季度:2026 Q1
Campaign 標籤:
活動名稱:春季煥膚祭
活動代碼:2026-SP-SKIN
期間:2026/03/01 - 2026/04/30
通路:全通路
目標客群:25-35 歲女性、保濕需求
KPI:新客佔比 30%
為什麼 AI 需要好的標籤?
想像你請 AI 分析「過去一年保濕類產品在 momo 的銷售趨勢」。如果你的產品資料裡沒有「功效分類」這個標籤,AI 根本不知道哪些產品屬於「保濕類」,只能瞎猜。
好的標籤系統可以讓 AI:
- 更精準地篩選和分析資料
- 自動分類新進資料
- 產出更有洞察的報告
- 跨部門整合資料時不會「雞同鴨講」
三、「垃圾進,垃圾出」:資料品質對 AI 的影響
這是資料科學界最經典的一句話:Garbage In, Garbage Out(垃圾進,垃圾出)。
實際案例:資料品質差會怎樣?
案例 1:格式不一致
你的銷售報表中,同一個產品在不同月份的名稱不同:
- 1 月:「玻尿酸精華液30ml」
- 2 月:「玻尿酸精華液 30ML」
- 3 月:「HA精華液(30ml)」
AI 會把這當成三個不同產品來分析,你的銷售趨勢圖就完全失真了。
案例 2:缺失值未處理
會員資料中有 40% 的年齡欄位是空白的。你請 AI 做顧客分群,結果它把這些人全部歸到「未知」群組,你的行銷策略就少了將近一半的客群洞察。
案例 3:過期資料未清理
你把去年已下架的產品 FAQ 也丟進 AI 知識庫,結果客服 AI 回答顧客時推薦了一個已經買不到的產品,顧客體驗直接扣分。
資料品質的四個維度
| 維度 | 說明 | 行銷場景 |
|---|---|---|
| 完整性 | 該有的欄位都有值 | 會員資料的電話、Email 是否齊全 |
| 一致性 | 同一件事的寫法統一 | 產品名稱、通路名稱是否每份報表都一樣 |
| 時效性 | 資料是最新的 | 產品價格、庫存、促銷資訊是否即時更新 |
| 正確性 | 資料內容是對的 | 產品成分、功效描述是否經過確認 |
四、實作:盤點你部門的資料資產
現在,花 15 分鐘做一件事:列出你部門現有的資料,並分類。
步驟
- 打開一份空白表格
- 回想你每天、每週、每月會接觸到哪些資料
- 把它們填入下面的分類表
- 標記每份資料的品質狀況
資料資產盤點表範例
| 資料名稱 | 類型 | 格式 | 更新頻率 | 存放位置 | 品質評估 |
|---|---|---|---|---|---|
| 月銷售報表 | 結構化 | Excel | 每月 | Google Drive | 格式一致 ✓ |
| IG 留言紀錄 | 非結構化 | 截圖/文字 | 不定期 | 個人電腦 | 未歸檔 ✗ |
| 產品成分表 | 結構化 | 新品上市時 | 共用硬碟 | 格式不一 ✗ | |
| 客服常見問題 | 非結構化 | Word | 很少更新 | 不確定 | 內容過期 ✗ |
AI 協作:學了這個,跟 AI 怎麼配合?
資料整理是讓 AI 發揮真正實力的前置作業 — 你決定了 AI 能吃什麼、吃得好不好。
你的人類優勢:
- 你最清楚自己部門有哪些資料、品質如何、哪些最有價值
- 你能判斷資料的「業務意義」,AI 只看到欄位和數字
可以這樣跟 AI 說:
我要盤點部門的資料資產。請幫我設計一份資料盤點表的模板,欄位包含:資料名稱、結構化/非結構化、格式、更新頻率、存放位置、品質評估(完整性/一致性/時效性/正確性)。然後根據以下部門業務範圍,幫我列出可能擁有的資料清單:[貼上你的部門職責描述]
練習
本堂重點回顧
- 結構化資料有固定欄位,適合數據分析;非結構化資料是自由格式,需要 AI 做理解和分類
- Metadata 和標籤讓 AI 能更精準地找到和分析資料,就像圖書館的索引系統
- 資料品質直接決定 AI 產出品質,四個維度:完整性、一致性、時效性、正確性
- 第一步永遠是:盤點你手上有什麼資料,然後決定優先整理哪些
下堂課預告:知道怎麼整理資料之後,我們要來學怎麼把這些資料變成一個「部門知識大腦」— 企業專屬知識庫。
挑戰任務
請為你的部門設計一份「資料分類表」。至少列出 8 項你部門現有的資料資產,並為每一項標註:(1) 結構化或非結構化、(2) 目前的存放位置、(3) 資料品質的主要問題(如有)。完成後,選出你認為最應該優先整理的 3 項資料,並說明原因。
以下哪些是結構化資料?哪些是非結構化資料?請分類並說明理由:(A) 每月廣告成效報表 (B) 顧客在蝦皮的產品評價 (C) 會員生日與消費金額清單 (D) 品牌社群的限動截圖 (E) 產品 SKU 與庫存數量表 (F) 內部 LINE 群組的行銷討論串
你發現銷售報表中,同一款產品「積雪草修護霜」在不同報表裡出現了以下寫法:(1) 積雪草修護霜50g (2) CICA修護霜 50G (3) 積雪草修復霜(50g) (4) cica repair cream 50g。這會對 AI 分析造成什麼影響?你會怎麼解決這個問題?