Macro-F1 trong bài toán nhiều lớp: Hiểu bản chất đánh giá mô hình theo cách cân bằng các lớp

Tác giả: AI VIET NAM (AI VIET NAM)

Keywords: Macro-F1, Đánh giá mô hình, Phân loại nhiều lớp, AI, Machine Learning

Mở đầu

Trong các bài toán phân loại nhiều lớp, người học thường gặp tình huống mô hình cho kết quả “đẹp” trên lớp phổ biến nhưng lại sai khá nhiều ở các lớp hiếm. Khi nhìn vào độ chính xác chung, mọi thứ có vẻ ổn; nhưng khi kiểm tra từng lớp riêng lẻ, sự mất cân đối xuất hiện khá rõ. Đây là lúc Macro-F1 trở thành công cụ đánh giá giúp nhìn lại mô hình một cách cân bằng hơn.

Macro-F1 là gì?

Macro-F1 được tính bằng cách:

  • Tính F1-score cho từng lớp riêng.
  • Lấy trung bình đều các F1-score đó.

Do không sử dụng trọng số theo tần suất xuất hiện của lớp, Macro-F1 giúp các lớp hiếm có “tiếng nói” ngang bằng với lớp phổ biến. Điều này làm nổi bật hiệu suất thật sự của mô hình trên từng nhóm dữ liệu.

Cách tính F1-score của một lớp được mô tả bằng:

F1 = 2 × (Precision × Recall) / (Precision + Recall)

Khi tính Macro-F1, ta chỉ đơn giản lấy trung bình đều của F1 từng lớp.

Ví dụ thực tế

Giả sử một mô hình phân loại 3 lớp:

  • Lớp A: nhiều dữ liệu → F1 = 0.95
  • Lớp B: trung bình → F1 = 0.70
  • Lớp C: ít dữ liệu → F1 = 0.40

Nếu chỉ nhìn Accuracy, mô hình có thể vẫn đạt >90% do lớp A chiếm đa số. Nhưng Macro-F1 sẽ là:

(0.95 + 0.70 + 0.40) / 3 = 0.683

Điều này thể hiện rõ khả năng của mô hình trên lớp C đang khá hạn chế.

Khi làm dự án AI/ML, Macro-F1 được dùng như thế nào?

Trong các dự án thực tế, dữ liệu thường không cân bằng:

  • Phân loại lỗi sản phẩm: lỗi hiếm mới quan trọng.
  • Phát hiện gian lận: gian lận luôn ít hơn hành vi bình thường.
  • Phân loại văn bản nhiều chủ đề: có những chủ đề rất ít mẫu.

Nếu dùng Accuracy, mô hình có thể bỏ qua các lớp hiếm mà vẫn đạt kết quả cao. Macro-F1 giúp nhóm làm dự án đánh giá công bằng hơn, đặc biệt trong giai đoạn kiểm thử và tối ưu mô hình.

Macro-F1 thường xuất hiện ở các buổi đánh giá mô hình trong nhóm kỹ thuật, nhằm đảm bảo mô hình không “thiên vị” bất kỳ lớp nào.

Liên hệ kiến thức nền trong lộ trình AI

Macro-F1 là phần kiến thức phổ biến trong:

  • module Machine Learning 1–2: phân loại, đánh giá mô hình, precision-recall
  • module Pre-Deep Learning: tối ưu hóa, hiểu metrics
  • module Deep Learning 1: theo dõi và logging trong pipeline MLOps
  • module NLP/CV: đánh giá mô hình phân loại nhiều lớp trong text hoặc ảnh

Đây là những nhóm kiến thức nền tảng mà người học AI thường tiếp cận khi triển khai bài toán phân loại thực tế.

Lời khuyên cho người bắt đầu

  • Bạn có thể thử tính Macro-F1 cho một bộ dữ liệu nhiều lớp nhỏ để thấy sự khác biệt giữa Accuracy và Macro-F1.
  • Bạn có thể kiểm tra F1 theo từng lớp để quan sát lớp nào đang gây khó cho mô hình.
  • Bạn có thể thử thay đổi cách lấy mẫu hoặc sử dụng kỹ thuật xử lý dữ liệu bất cân bằng để xem Macro-F1 thay đổi thế nào.

Hỏi đáp nhanh về Macro-F1

Macro-F1 có xem xét tần suất lớp không?
→ Không, Macro-F1 cho trọng số ngang nhau giữa các lớp.

Macro-F1 có phù hợp cho dữ liệu lệch lớp không?
→ Có, vì nó phản ánh hiệu suất từng lớp một cách công bằng.

Macro-F1 có giống Weighted-F1 không?
→ Không, Weighted-F1 dùng trọng số theo tần suất lớp.

Macro-F1 có dùng được cho phân loại nhiều lớp không?
→ Có, đây là một trong những cách đánh giá phổ biến nhất.


FAQ về chương trình AIO

Q1. Con số 0 thì học nổi không?
Ans: Chỉ cần bạn có thời gian học. Điều quan trọng nhất không phải giỏi hay không, mà là có học đều mỗi ngày. Kiến thức – tài liệu – môi trường đã có team lo. Nếu bạn không có thời gian thì nên cân nhắc.

Q2. Ai dạy AIO?
Ans: Đội admin dạy toàn bộ. Admin trực tiếp hướng dẫn và hỗ trợ mọi câu hỏi của bạn trong suốt quá trình học.

Q3. Admin có “xịn” không?
Ans: Admin đều là người làm nghề thật, mỗi người một cách dạy. Quan trọng là bạn cảm thấy hợp cách truyền đạt. Admin không dám nói xịn, chỉ dạy bằng hết sức.

Q4. AIO có gì khác những nơi khác?
Ans: AIO không phải trung tâm. Đây là dự án học tập cộng đồng, được cải tiến qua từng khóa. Tinh thần của AIO: Cùng nhau học – cùng nhau khổ – cùng nhau lớn. Nếu hợp tinh thần đó, bạn sẽ thấy phù hợp.

Tài nguyên học AI: