Metric MAE và MSE thường được dùng để đánh giá mô hình Deep Learning cho bài toán hồi quy như thế nào?

Mở bài

Khi bắt đầu làm bài toán hồi quy trong Machine Learning hoặc Deep Learning, nhiều người thường gặp một câu hỏi quen thuộc: nên dùng MAE hay MSE để đánh giá mô hình? Hai metric này nghe qua khá giống nhau, nhưng cách chúng phản ứng với sai số lại khác biệt rõ rệt. Việc hiểu đúng bản chất giúp chọn metric phù hợp hơn khi xây mô hình.

Giải thích dễ hiểu về MAE và MSE

MAE (Mean Absolute Error)

MAE đo trung bình độ lệch tuyệt đối giữa dự đoán và giá trị thật.
Theo dạng mô tả:
MAE = trung bình của |y_pred – y_true|
MAE phản ánh sai số theo “khoảng cách thực tế”. Sai số lớn hay nhỏ đều được tính theo một mức đóng góp tương đối ổn định, không phóng đại.

MSE (Mean Squared Error)

MSE đo trung bình sai số bình phương:
MSE = trung bình của (y_pred – y_true)^2
Vì sai số được bình phương, các điểm lệch lớn bị phóng đại mạnh. Điều này khiến MSE nhạy với outlier và được dùng nhiều khi muốn mô hình chú trọng sửa các sai số lớn.

Ví dụ thực tế minh họa

Giả sử dự đoán giá nhà, bạn có 3 căn lệch 10 triệu, 12 triệu và 100 triệu.

Với MAE: sai số trung bình sẽ gần mức lệch trung bình thực tế.
Với MSE: căn lệch 100 triệu sẽ góp phần rất lớn, khiến metric tăng mạnh.

Nếu dữ liệu chứa vài giá trị bất thường do lỗi nhập, MAE thường ổn định hơn.
Nhưng nếu chênh lệch lớn mang ý nghĩa quan trọng (ví dụ dự đoán chi phí trong logistics), MSE giúp mô hình quan tâm nhiều hơn tới khoản sai số đó.

Góc nhìn khi làm dự án AI/ML

Trong dự án thực tế, việc lựa chọn metric phụ thuộc vào mục tiêu kinh doanh và bản chất dữ liệu.

Khi dữ liệu có outlier tự nhiên (ví dụ giá cổ phiếu biến động), MSE giúp mô hình học tốt hơn vùng sai số lớn.
Khi làm hệ thống dự đoán nhu cầu, nơi dữ liệu có nhiều biến động do lỗi đo hoặc yếu tố khó kiểm soát, nhóm dự án thường dùng MAE vì tính ổn định.

Trong MLOps, các metric này sẽ xuất hiện xuyên suốt pipeline: từ quá trình training, validation cho tới khi model được monitoring sau deploy.

Liên hệ với kiến thức nền AI

MAE và MSE thường được giới thiệu trong các phần về losses & metrics của nhóm kiến thức Pre-Deep Learning và Machine Learning cơ bản (tương tự Module 4–5 trong lộ trình AIO).
Khi đi sâu vào mạng Neural Network, đặc biệt là ở giai đoạn tối ưu hóa trong Deep Learning, hiểu cách hai metric này ảnh hưởng đến gradient giúp việc tuning model thuận tiện hơn.

Lời khuyên học thuật dành cho người mới

Bạn có thể thử tự tạo một tập dữ liệu nhỏ và so sánh cách MAE và MSE thay đổi khi đưa thêm một vài điểm outlier. Điều này giúp cảm nhận rõ ràng hơn cách mỗi metric phản ứng với sai số.

Hỏi đáp nhanh về MAE – MSE

MAE có nhạy với outlier không?
Không, MAE ít bị ảnh hưởng bởi outlier.
MSE có làm sai số lớn trở nên nổi bật hơn không?
Có, vì sai số được bình phương.
Có thể dùng đồng thời MAE và MSE trong cùng một dự án không?
Có, và điều này khá phổ biến.
MAE và MSE có dùng cho classification không?
Không, chúng được dùng cho regression.

FAQ về chương trình AIO

Q1. Con số 0 thì học nổi không?
Ans: Chỉ cần bạn có thời gian học. Điều quan trọng nhất không phải giỏi hay không, mà là có học đều mỗi ngày. Kiến thức – tài liệu – môi trường đã có team lo. Nếu bạn không có thời gian thì nên cân nhắc.

Q2. Ai dạy AIO?
Ans: Đội admin dạy toàn bộ. Admin trực tiếp hướng dẫn và hỗ trợ mọi câu hỏi của bạn trong suốt quá trình học.

Q3. Admin có “xịn” không?
Ans: Admin đều là người làm nghề thật, mỗi người một cách dạy. Quan trọng là bạn cảm thấy hợp cách truyền đạt. Admin không dám nói xịn, chỉ dạy bằng hết sức.

Q4. AIO có gì khác những nơi khác?
Ans: AIO không phải trung tâm. Đây là dự án học tập cộng đồng, được cải tiến qua từng khóa. Tinh thần của AIO: Cùng nhau học – cùng nhau khổ – cùng nhau lớn. Nếu hợp tinh thần đó, bạn sẽ thấy phù hợp.