跳到主要內容
Cypher's Practical Coding
正在準備工作環境...

為什麼要清洗資料?

電商業務常從 Excel 匯出 CSV,內容夾雜多餘空格、重複列、日期寫法不一致,報表就會失真。資料清洗就是把資料「整理到能用」:統一格式、去除重複、補齊缺漏,讓分析結果可信。

你會學到什麼

  • 認識「髒資料」的常見問題
  • 了解為什麼用 JavaScript 來做清洗
  • trim()toLowerCase()Set 做第一次清洗

一眼看懂髒資料

問題例子風險
多餘空格" Nike""Nike "同一品牌被當成兩個
重複列同筆訂單重複匯出營收重算兩次
格式不一2026/02/01 vs 02-01-2026日期排序錯誤
大小寫不統一"nike" vs "Nike"搜尋或統計時漏掉

這些問題在 Excel 裡要手動找、手動改,資料量一大就不可能一筆一筆看。程式可以幫你「全部一次清」。

為什麼用 JavaScript?

  • 瀏覽器裡直接跑,不用安裝程式或請 IT 幫忙
  • console.log 就能看到結果,適合邊試邊改
  • 處理 CSV、JSON 都有內建方法,語法直覺
  • 很多公司的前端和後台都用 JavaScript,學了馬上能用

快速示範:toLowerCase 統一大小寫

大小寫不統一是最常見的髒資料問題之一。toLowerCase() 把所有字母轉成小寫:

快速示範:trim 與去重

最常見的清洗動作就是「去空格 + 統一大小寫 + 去重複」。看看只要三行就能搞定:

這段程式做了三件事:

  1. trim() — 去除每個品牌名前後的空格
  2. toLowerCase() — 全部轉小寫,讓 "Nike" 和 "nike" 變成同一個
  3. new Set() — Set 自動去除重複,再用 [...] 轉回陣列

小提醒:map() 是「對陣列裡的每個元素做同一件事」。你不需要寫 for 迴圈,一行就搞定。

AI 協作:學了這個,跟 AI 怎麼配合?

你會需要清洗資料的場景比你想像的多——AI 給你的程式碼也常需要先清洗輸入。

你的人類優勢:

  • 你知道資料從哪來、應該長什麼樣(Excel 匯出、API 回傳、手動輸入)
  • 你能定義「乾淨」的標準:去空白、去重、格式統一

可以這樣跟 AI 說:

我從 Excel 匯出一份客戶名單,有空白列、重複的名字、前後有空格。幫我用 JavaScript 清洗乾淨。

練習題

互動示範

DEMO 1可以修改程式碼試玩
DEMO 2可以修改程式碼試玩

挑戰任務

Task 1

將陣列 [' Puma', 'puma', 'PUMA '] 清洗後去重,印出結果

Task 2

將字串 ' Hello World ' 去除前後空格後印出

Task 3

將陣列 ['Hello', 'WORLD'] 全部轉小寫後印出

Next Lesson →