DataFrame 基本操作
在電商後台,你每天都要查看商品清單、庫存與價格。pandas 的 DataFrame 就像一個「超級 Excel 表格」,讓你用程式快速篩選、統計、更新資料。這一課會帶你認識最常用的幾個操作,讓你能在幾行程式內完成日常報表工作。
你會學到什麼
- 用
head()快速瀏覽資料 - 選取單一或多個欄位
- 用
mean()、max()等做基本統計
查看資料
當你剛讀入一個 DataFrame,第一件事通常是「先瞄一眼」。head() 就像在 Excel 只看前幾列,確認欄位與數值是否正常,避免後面分析踩雷。
小提醒:
head()預設顯示 5 筆,可傳入數字(例如head(3))決定要看幾筆;資料過大時不要直接print(df),容易刷屏。
選取欄位
想像 Excel 的欄位。當你只想看商品名稱,或拿某個欄位去比對別張表,就會用到欄位選取。DataFrame 的欄位名稱放在中括號裡即可。
小提醒:欄位名稱大小寫、全形半形都要精確一致;用點號
df.商品雖然可行,但遇到空白或特殊字元會失效,建議統一用中括號。
選取多個欄位
做報表時常需要「擷取幾個重要欄位」再交給同事。就像在 Excel 手動選多欄,pandas 只要給一個欄位名稱的清單即可。
小提醒:內層的欄位名稱必須是列表(雙中括號)。若只用單中括號放列表,會被當作索引列,導致錯誤。
基本統計
定價、促銷、補貨決策都離不開統計摘要。mean()、max()、min()、sum() 就像在 Excel 按下平均值/最大值等按鈕,但可以直接鏈在資料流裡,不用額外點選。
小提醒:統計前先確認欄位型態是數值(
df.dtypes可檢查)。如果是字串,結果會怪怪的;必要時先用astype(int)或pd.to_numeric()轉型。
AI 協作:學了這個,跟 AI 怎麼配合?
DataFrame 的欄位操作(選欄位、改名、新增計算欄)是你跟 AI 協作最頻繁的部分。
你的人類優勢:
- 你知道報表需要哪些欄位,以及衍生欄位的計算邏輯(利潤 = 營收 - 成本)
- 你能驗證新欄位的計算結果是否合理
可以這樣跟 AI 說:
幫我在 DataFrame 新增一欄 profit,計算方式是 revenue - cost,然後把 profit 為負的標記為「虧損」。
練習題
互動示範
挑戰任務
建立 DataFrame:商品 ['T恤','牛仔褲','外套','襯衫']、價格 [590,1290,2490,890],印出平均價格(轉整數)
建立 DataFrame:商品 ['T恤','牛仔褲','外套']、價格 [590,1290,2490]、庫存 [100,50,30],印出欄位名稱列表
使用同上 DataFrame,印出庫存最少的商品名稱