Nội dung bài viết

1. Nếu bạn đang quen Excel, vì sao nên học thêm Pandas?
1.1. Thực tế:
2. Pandas khác gì – và giống gì – so với Excel?
2.1. Nghĩ theo “từ điển Excel” cho dễ:
2.2. Điểm khác biệt lớn:
3. Trước khi vào Pandas: cần biết Python tới mức nào?
4. 7 bước cơ bản để chuyển từ Excel → Pandas (phiên bản không ngợp)
5. Bước 1: Chuẩn bị môi trường – dùng Jupyter hoặc Google Colab
5.1. Dễ nhất cho người mới:
6. Bước 2: Đọc chính file Excel/CSV mà bạn đang dùng hằng ngày
7. Bước 3: Làm lại các thao tác bạn hay làm trong Excel
7.1. Lọc
7.2. Sắp xếp
7.3. Pivot
7.4. Tạo cột mới
8. Bước 4: Làm quen với EDA cơ bản
9. Bước 5: Tập thay thế một báo cáo Excel bằng một notebook Pandas
10. Bước 6: Xuất kết quả Pandas ngược sang Excel/CSV để chia sẻ
11. Bước 7: Từ Pandas → EDA nâng cao → Machine Learning
11.1. Làm EDA nâng cao
11.2. Làm thử mô hình ML
12. Nếu chỉ quen Excel, mất bao lâu để quen Pandas?
13. Pandas được đưa vào chương trình 1 năm AIO như thế nào?
13.1. Lộ trình Pandas trong AIO:
14. FAQ – Người từ Excel sang Pandas hay hỏi
14.1. Không giỏi Excel → học Pandas được không?
14.2. Không giỏi lập trình → học Pandas nổi không?
14.3. Có phải bỏ Excel không?
14.4. Máy yếu học được Pandas không?
14.5. Biết Pandas đã đủ để làm Data Science chưa?
15. Tài nguyên học thêm (theo chuẩn AI VIET NAM)

© 2025 AI VIET NAM. All rights reserved.

Các Bước Cơ Bản Để Bắt Đầu Làm Quen Với Pandas Nếu Bạn Chỉ Quen Excel Trước Đó

Tác giả: AI VIET NAM (hướng dẫn Pandas cho newbie)

Keywords: hướng dẫn Pandas cho newbie

Nếu bạn đang quen Excel, vì sao nên học thêm Pandas?

Rất nhiều bạn trong cộng đồng AI VIET NAM và các học viên AIO gặp đúng tình trạng:

  • Làm báo cáo, xử lý dữ liệu ổn bằng Excel
  • Nghe nói muốn vào AI/Data Science phải biết Pandas + Python
  • Mở tài liệu ra thì thấy toàn code → choáng

Thực tế:

Bạn không cần bỏ Excel.
Pandas chỉ là nâng cấp thêm một “vũ khí” mạnh:

  • Tự động hóa thay vì làm bằng tay
  • Xử lý được dữ liệu lớn
  • Kết nối trực tiếp vào ML/AI
  • Lặp lại quy trình phân tích nhanh và chính xác

Pandas khác gì – và giống gì – so với Excel?

Nghĩ theo “từ điển Excel” cho dễ:

ExcelPandas
SheetDataFrame
Filterdf[df[“col”] > 0]
Sortdf.sort_values()
Pivot tablegroupby(), pivot_table()
Công thức tạo cột mớidf["new_col"] = ...

Điểm khác biệt lớn:

  • Excel: làm bằng chuột → mỗi lần báo cáo lại phải làm lại
  • Pandas: làm bằng code → chạy lại toàn bộ chỉ với một nút bấm

Nếu coi Pandas là “Excel nâng cấp + tự động hóa + kết nối ML”, bạn sẽ thấy nó thân thiện hơn nhiều.


Trước khi vào Pandas: cần biết Python tới mức nào?

Không cần cao siêu. Chỉ cần:

  • Biết chạy Jupyter/Colab
  • Biết biến, list, dict
  • Biết for/if cơ bản

Trong AIO, phần Python nền được học trước rồi mới vào Pandas nên người Non-Tech cũng theo được.


7 bước cơ bản để chuyển từ Excel → Pandas (phiên bản không ngợp)


Bước 1: Chuẩn bị môi trường – dùng Jupyter hoặc Google Colab

Dễ nhất cho người mới:

  • Google Colab:
    • Không cài gì
    • Chạy ngay trên trình duyệt
    • Upload file Excel/CSV lên là làm được

Hoặc:

  • Jupyter Notebook (Anaconda) nếu muốn chạy trên máy.

Mục tiêu giai đoạn này:
Mở được notebook → gõ vài dòng → chạy cell thành công.


Bước 2: Đọc chính file Excel/CSV mà bạn đang dùng hằng ngày

Đừng bắt đầu bằng dataset lạ.
Hãy dùng:

  • File doanh thu
  • File bán hàng
  • Danh sách khách hàng
  • File bạn đang xử lý hằng tuần

Sau đó:

  • Dùng
    read_csv()
    hoặc
    read_excel()
  • Xem 5 dòng đầu, số dòng, số cột, tên cột

Bạn sẽ bất ngờ vì DataFrame nhìn giống Excel 90%.


Bước 3: Làm lại các thao tác bạn hay làm trong Excel

Đừng học toàn bộ Pandas trong 1 ngày.
Hãy học vừa đủ để thay thế thao tác quen thuộc:

Lọc

Excel: filter
Pandas:

df[df["col"] == "A"]

Sắp xếp

Excel: sort
Pandas:

df.sort_values("col")

Pivot

Excel: pivot
Pandas:

df.groupby("col").agg(...)

Tạo cột mới

Excel: =C2 * 1.1
Pandas:

df["new"] = df["col"] * 1.1

Khi làm được những thao tác này → bạn đã “chuyển hệ” thành công 40%.


Bước 4: Làm quen với EDA cơ bản

Excel:

  • Kéo chuột để xem dữ liệu
  • Nhìn ra outlier bằng mắt

Pandas cho bạn “superpower” hơn:

  • Xem info: kiểu dữ liệu, số dòng
  • Describe: mean, median, min, max
  • Đếm missing/null
  • Đếm số giá trị khác nhau
  • Vẽ histogram, boxplot (với Matplotlib)

Đây là EDA – bước cực quan trọng trong Data Science/AI.


Bước 5: Tập thay thế một báo cáo Excel bằng một notebook Pandas

Chọn 1 báo cáo đơn giản bạn làm hàng tuần:

Ví dụ:

  • Doanh thu theo tháng
  • Top sản phẩm bán chạy
  • Tổng số đơn theo kênh

Viết notebook gồm:

  • Đọc file
  • Làm sạch nhẹ
  • groupby/pivot
  • Xuất kết quả hoặc plot

Lần sau chỉ cần đổi file → chạy lại toàn bộ.
Bạn đã tự động hóa một việc thủ công.


Bước 6: Xuất kết quả Pandas ngược sang Excel/CSV để chia sẻ

Sếp/team thường không đọc notebook → nên xuất kết quả:

  • to_csv()
  • to_excel()
  • Hoặc đưa lên Google Sheets

Pandas xử lý backend → Excel làm frontend.
Combo hoàn hảo cho dân văn phòng chuyển ngành.


Bước 7: Từ Pandas → EDA nâng cao → Machine Learning

Khi đã quen:

  • Đọc/ghi file
  • groupby
  • xử lý cột/hàng
  • tạo báo cáo

Bạn có thể bước tiếp:

Làm EDA nâng cao

Nhiều biểu đồ
Phân tích sâu

Làm thử mô hình ML

  • Linear Regression
  • Logistic Regression
  • Clustering (KMeans)

Lúc này Pandas trở thành cánh cửa để bước vào thế giới AI/DS.


Nếu chỉ quen Excel, mất bao lâu để quen Pandas?

Thực hành 2–3 mini-project thực tế → đã đủ để “vào form”.
Người mới thường mất:

  • 2–4 tuần nếu học đều
  • 1–2 tháng nếu học nhẹ nhàng

Quan trọng không phải “học trong bao lâu”, mà là học bằng dữ liệu của chính bạn.

Trong AIO, Pandas luôn gắn với case thực tế:
phân tích bán hàng, EDA Airbnb, dữ liệu ô nhiễm, churn, segmentation…


Pandas được đưa vào chương trình 1 năm AIO như thế nào?

AIO2026 – chương trình AI/Data Science 1 năm cho Newbie & Non-Tech.

Lộ trình Pandas trong AIO:

Pre-AIO

  • Python nền
  • Toán cơ bản
  • Tư duy lập trình

Module Data, SQL, EDA

  • Học Pandas song song SQL
  • Thực hành trên file thật
  • Làm phân tích thực tế (marketing, bán hàng, ô nhiễm…)

Giai đoạn sau
Pandas được dùng xuyên suốt:

  • ML tabular
  • Time-Series
  • NLP
  • CV
  • Chuẩn bị data cho các dự án lớn

AIO yêu cầu cam kết ≥ 28h/tuần → đổi lại:

  • Kiến thức thật
  • 22+ dự án thực hành
  • Mentor đồng hành
  • Feedback chi tiết

FAQ – Người từ Excel sang Pandas hay hỏi

Không giỏi Excel → học Pandas được không?

Được. Excel & Pandas hỗ trợ nhau.

Không giỏi lập trình → học Pandas nổi không?

Hoàn toàn được.
Pandas là cách nhẹ nhàng nhất để làm quen code.

Có phải bỏ Excel không?

Không.
Pandas xử lý backend → Excel trình bày frontend.

Máy yếu học được Pandas không?

Được.
Dùng Colab hoặc dataset vừa phải.

Biết Pandas đã đủ để làm Data Science chưa?

Chưa.
Nhưng Pandas là nền bắt buộc để đi tiếp vào ML/AI.


Tài nguyên học thêm (theo chuẩn AI VIET NAM)