Nội dung bài viết
© 2025 AI VIET NAM. All rights reserved.
Tác giả: AI VIET NAM (regression là gì)
Keywords: regression là gì
Bạn đang hỏi: “Nhìn bài toán thực tế thì làm sao biết đó là Regression hay Classification? Có phải cứ dự đoán số là Regression, dự đoán nhãn là Classification không?”
Tóm gọn: Regression = dự đoán giá trị liên tục. Classification = dự đoán nhãn/nhóm rời rạc.
Chỉ cần nhìn vào output, bạn đã phân loại được 80% bài toán.
Bài viết này sẽ giúp bạn:
Regression = dự đoán một con số liên tục, không bị giới hạn vào vài nhóm cố định.
Dự đoán giá:
Dự đoán lượng/khối lượng:
Dự đoán thời gian:
Đặc trưng:
Gợi ý nhận diện:
“how much / how many / how long” → rất có thể là Regression.
Classification = gán mỗi mẫu vào một hoặc nhiều nhãn rời rạc.
Binary (2 lớp):
Multi-class:
Multi-label:
Đặc trưng:
Gợi ý nhận diện:
“thuộc loại nào / good or bad / spam or not” → Classification.
Người mới hay xem các cột đầu vào (toàn số) rồi tưởng là Regression.
Điều quan trọng là bài toán yêu cầu dự đoán cái gì.
Kết quả cần là số liên tục hay nhãn?
→ Liên tục = Regression, rời rạc = Classification.
Business cần “đúng nhóm” hay “đúng giá trị”?
→ Nhóm → Classification.
→ Giá trị cụ thể → Regression.
Nếu nhóm lại/giảm độ chi tiết thì còn ý nghĩa không?
→ Còn → Classification.
→ Mất ý nghĩa → Regression.
Trông như dự đoán số nhưng thực chất:
Dù thu nhập là số, nhưng nếu bài toán chỉ cần biết:
50m
→ Output là nhóm → Classification.
| Đặc điểm | Regression | Classification |
|---|---|---|
| Output | Số thực liên tục | Nhãn rời rạc |
| Câu hỏi | Bao nhiêu? Trong khoảng nào? | Thuộc loại nào? Là A hay B? |
| Ví dụ | Giá nhà, ô nhiễm, thời gian | Spam, churn, chó/mèo |
| Metric | MSE, RMSE, MAE, R² | Accuracy, Precision, Recall, F1, ROC–AUC |
| Mô hình đơn giản | Linear Regression | Logistic Regression, Tree, RF, XGBoost |
Có – và rất phổ biến.
Hãy nhớ: Việc chọn formulation phụ thuộc mục tiêu business.
Rating 1–5, nhóm thu nhập → đều là Classification.
Mô hình churn có thể là:
Hãy hỏi xem business cần gì.
MSE cho classification → vô nghĩa
Accuracy cho regression → sai hoàn toàn
Regression:
Classification:
Làm nhiều sẽ thành trực giác.
AIO2026 – chương trình AI & Data Science 1 năm dành cho Newbie & Non-Tech:
Yêu cầu: ≥ 28 giờ/tuần
Cam kết: kiến thức thật – dự án thật – mentor đồng hành
Chỉ cần trực giác:
Dự đoán số → Regression.
Dự đoán nhóm → Classification.
Không.
Reg → MSE/RMSE/MAE
Class → Accuracy/F1/ROC–AUC
Có (Reg → Class).
Ngược lại thì khó hơn.
Có – rất nhiều.
Đây là hai “trụ cột” của ML.