Nội dung bài viết
© 2025 AI VIET NAM. All rights reserved.
Tác giả: AI VIET NAM (AI VIET NAM)
Keywords: ROC Curve, AUC, Phân loại nhị phân, Đánh giá mô hình
Khi làm các bài toán phân loại nhị phân, đặc biệt là trong giai đoạn đánh giá mô hình, nhiều người dễ gặp khó khi phải hiểu vì sao mô hình có thể cho ra cùng một xác suất dự đoán nhưng chất lượng lại thay đổi theo từng ngưỡng. Việc lựa chọn một ngưỡng cố định (ví dụ 0.5) thường không phản ánh được đầy đủ khả năng phân biệt của mô hình trên toàn bộ dữ liệu. Đây là lý do ROC Curve và AUC trở thành hai chỉ số quan trọng.
ROC (Receiver Operating Characteristic) mô tả cách mô hình phân loại nhị phân phản ứng khi thay đổi ngưỡng phân loại. Nó so sánh hai đại lượng trên nhiều ngưỡng:
Khi thay đổi ngưỡng, TPR và FPR sẽ thay đổi theo, tạo thành một đường cong ROC. Đường cong không đánh giá mô hình tại một điểm cụ thể, mà nhìn vào toàn bộ hành vi khi quét qua mọi ngưỡng.
AUC (Area Under the Curve) là diện tích phía dưới đường ROC. Giá trị AUC dao động từ 0 đến 1:
Khái niệm AUC liên quan trực tiếp đến ý tưởng chọn một ngưỡng bất kỳ và kiểm tra xác suất mô hình xếp điểm dự đoán của mẫu dương cao hơn mẫu âm.
Điểm cốt lõi nằm ở việc mô hình tạo ra xác suất chứ không phải nhãn. Ngưỡng dự đoán chỉ là cách biến xác suất thành nhãn.
ROC–AUC không bị ràng buộc bởi bất kỳ ngưỡng nào. Khi quét qua toàn bộ các ngưỡng:
Vì vậy, ROC–AUC phản ánh khả năng phân tách bản chất của mô hình, không bị ảnh hưởng bởi lựa chọn ngưỡng.
Giả sử một hệ thống phát hiện gian lận giao dịch:
Khi vẽ ROC:
Kết luận: mô hình A phân biệt hai nhóm tốt hơn ở mọi ngưỡng.
Trong triển khai thực tế, ROC–AUC giúp:
Ở các pipeline dạng ML Ops, việc log thêm ROC–AUC ở từng phiên bản mô hình cũng giúp theo dõi sự thay đổi chất lượng theo thời gian.
ROC–AUC xuất hiện trong nhiều phần của lộ trình học AI, đặc biệt ở:
Đây là một nhóm kiến thức nền mà người học ML thường gặp trước khi đi sâu vào các ứng dụng lớn hơn.
Bạn có thể thử vẽ ROC Curve trên một bộ dữ liệu nhỏ và thay đổi ngưỡng để quan sát mô hình phản ứng ra sao. Việc quan sát trực tiếp giúp hiểu sâu bản chất khả năng phân biệt của mô hình.
ROC có phụ thuộc vào ngưỡng cố định không?
Không, ROC xem xét toàn bộ ngưỡng.
AUC có bị ảnh hưởng bởi cân bằng lớp không?
Ảnh hưởng ít hơn so với Accuracy.
AUC có thể nhỏ hơn 0.5 không?
Có, nếu mô hình phân biệt ngược.
TPR và FPR có thể dùng để tối ưu mô hình không?
Có, vì chúng mô tả cách mô hình đánh đổi giữa bắt đúng và bắt nhầm.
Q1. Con số 0 thì học nổi không?
Ans: Chỉ cần bạn có thời gian học. Điều quan trọng nhất không phải giỏi hay không, mà là có học đều mỗi ngày. Kiến thức – tài liệu – môi trường đã có team lo. Nếu bạn không có thời gian thì nên cân nhắc.
Q2. Ai dạy AIO?
Ans: Đội admin dạy toàn bộ. Admin trực tiếp hướng dẫn và hỗ trợ mọi câu hỏi của bạn trong suốt quá trình học.
Q3. Admin có “xịn” không?
Ans: Admin đều là người làm nghề thật, mỗi người một cách dạy. Quan trọng là bạn cảm thấy hợp cách truyền đạt. Admin không dám nói xịn, chỉ dạy bằng hết sức.
Q4. AIO có gì khác những nơi khác?
Ans: AIO không phải trung tâm. Đây là dự án học tập cộng đồng, được cải tiến qua từng khóa. Tinh thần của AIO: Cùng nhau học – cùng nhau khổ – cùng nhau lớn. Nếu hợp tinh thần đó, bạn sẽ thấy phù hợp.