正在準備工作環境...
為什麼要清洗資料?
電商業務常從 Excel 匯出 CSV,內容夾雜多餘空格、重複列、日期寫法不一致,報表就會失真。資料清洗就是把資料「整理到能用」:統一格式、去除重複、補齊缺漏,讓分析結果可信。
你會學到什麼
- 認識「髒資料」的常見問題
- 了解為什麼用 JavaScript 來做清洗
- 用
trim()、toLowerCase()和Set做第一次清洗
一眼看懂髒資料
| 問題 | 例子 | 風險 |
|---|---|---|
| 多餘空格 | " Nike"、"Nike " | 同一品牌被當成兩個 |
| 重複列 | 同筆訂單重複匯出 | 營收重算兩次 |
| 格式不一 | 2026/02/01 vs 02-01-2026 | 日期排序錯誤 |
| 大小寫不統一 | "nike" vs "Nike" | 搜尋或統計時漏掉 |
這些問題在 Excel 裡要手動找、手動改,資料量一大就不可能一筆一筆看。程式可以幫你「全部一次清」。
為什麼用 JavaScript?
- 瀏覽器裡直接跑,不用安裝程式或請 IT 幫忙
console.log就能看到結果,適合邊試邊改- 處理 CSV、JSON 都有內建方法,語法直覺
- 很多公司的前端和後台都用 JavaScript,學了馬上能用
快速示範:toLowerCase 統一大小寫
大小寫不統一是最常見的髒資料問題之一。toLowerCase() 把所有字母轉成小寫:
快速示範:trim 與去重
最常見的清洗動作就是「去空格 + 統一大小寫 + 去重複」。看看只要三行就能搞定:
這段程式做了三件事:
trim()— 去除每個品牌名前後的空格toLowerCase()— 全部轉小寫,讓 "Nike" 和 "nike" 變成同一個new Set()— Set 自動去除重複,再用[...]轉回陣列
小提醒:
map()是「對陣列裡的每個元素做同一件事」。你不需要寫 for 迴圈,一行就搞定。
AI 協作:學了這個,跟 AI 怎麼配合?
你會需要清洗資料的場景比你想像的多——AI 給你的程式碼也常需要先清洗輸入。
你的人類優勢:
- 你知道資料從哪來、應該長什麼樣(Excel 匯出、API 回傳、手動輸入)
- 你能定義「乾淨」的標準:去空白、去重、格式統一
可以這樣跟 AI 說:
我從 Excel 匯出一份客戶名單,有空白列、重複的名字、前後有空格。幫我用 JavaScript 清洗乾淨。
練習題
互動示範
DEMO 1可以修改程式碼試玩
DEMO 2可以修改程式碼試玩
挑戰任務
Task 1
將陣列 [' Puma', 'puma', 'PUMA '] 清洗後去重,印出結果
Task 2
將字串 ' Hello World ' 去除前後空格後印出
Task 3
將陣列 ['Hello', 'WORLD'] 全部轉小寫後印出
Next Lesson →