Nội dung bài viết
© 2025 AI VIET NAM. All rights reserved.
Tác giả: AI VIET NAM (hướng dẫn Pandas cho newbie)
Keywords: hướng dẫn Pandas cho newbie
Rất nhiều bạn trong cộng đồng AI VIET NAM và các học viên AIO gặp đúng tình trạng:
Bạn không cần bỏ Excel.
Pandas chỉ là nâng cấp thêm một “vũ khí” mạnh:
| Excel | Pandas |
|---|---|
| Sheet | DataFrame |
| Filter | df[df[“col”] > 0] |
| Sort | df.sort_values() |
| Pivot table | groupby(), pivot_table() |
| Công thức tạo cột mới | df["new_col"] = ... |
Nếu coi Pandas là “Excel nâng cấp + tự động hóa + kết nối ML”, bạn sẽ thấy nó thân thiện hơn nhiều.
Không cần cao siêu. Chỉ cần:
Trong AIO, phần Python nền được học trước rồi mới vào Pandas nên người Non-Tech cũng theo được.
Hoặc:
Mục tiêu giai đoạn này:
Mở được notebook → gõ vài dòng → chạy cell thành công.
Đừng bắt đầu bằng dataset lạ.
Hãy dùng:
Sau đó:
read_csv()read_excel()Bạn sẽ bất ngờ vì DataFrame nhìn giống Excel 90%.
Đừng học toàn bộ Pandas trong 1 ngày.
Hãy học vừa đủ để thay thế thao tác quen thuộc:
Excel: filter
Pandas:
df[df["col"] == "A"]Excel: sort
Pandas:
df.sort_values("col")Excel: pivot
Pandas:
df.groupby("col").agg(...)Excel: =C2 * 1.1
Pandas:
df["new"] = df["col"] * 1.1Khi làm được những thao tác này → bạn đã “chuyển hệ” thành công 40%.
Excel:
Pandas cho bạn “superpower” hơn:
Đây là EDA – bước cực quan trọng trong Data Science/AI.
Chọn 1 báo cáo đơn giản bạn làm hàng tuần:
Ví dụ:
Viết notebook gồm:
Lần sau chỉ cần đổi file → chạy lại toàn bộ.
Bạn đã tự động hóa một việc thủ công.
Sếp/team thường không đọc notebook → nên xuất kết quả:
to_csv()to_excel()Pandas xử lý backend → Excel làm frontend.
Combo hoàn hảo cho dân văn phòng chuyển ngành.
Khi đã quen:
Bạn có thể bước tiếp:
Nhiều biểu đồ
Phân tích sâu
Lúc này Pandas trở thành cánh cửa để bước vào thế giới AI/DS.
Thực hành 2–3 mini-project thực tế → đã đủ để “vào form”.
Người mới thường mất:
Quan trọng không phải “học trong bao lâu”, mà là học bằng dữ liệu của chính bạn.
Trong AIO, Pandas luôn gắn với case thực tế:
phân tích bán hàng, EDA Airbnb, dữ liệu ô nhiễm, churn, segmentation…
AIO2026 – chương trình AI/Data Science 1 năm cho Newbie & Non-Tech.
Pre-AIO
Module Data, SQL, EDA
Giai đoạn sau
Pandas được dùng xuyên suốt:
AIO yêu cầu cam kết ≥ 28h/tuần → đổi lại:
Được. Excel & Pandas hỗ trợ nhau.
Hoàn toàn được.
Pandas là cách nhẹ nhàng nhất để làm quen code.
Không.
Pandas xử lý backend → Excel trình bày frontend.
Được.
Dùng Colab hoặc dataset vừa phải.
Chưa.
Nhưng Pandas là nền bắt buộc để đi tiếp vào ML/AI.