Công thức dự đoán cơ bản của Linear Regression (ŷ = wx + b) là gì?

Mở đầu

Khi mới học Machine Learning, Linear Regression thường là mô hình đầu tiên xuất hiện. Nhưng với nhiều bạn, công thức dự đoán $\hat{y} = wx + b$ đôi khi tạo cảm giác trừu tượng:

$w$ đại diện cho điều gì?
$b$ có vai trò gì?
Tại sao một công thức tuyến tính đơn giản lại mô tả được mô hình dự đoán?

Những thắc mắc này rất phổ biến khi bắt đầu với Regression – nhóm kiến thức nền tảng trong ML.

Công thức $\hat{y} = wx + b$ có nghĩa là gì?

Công thức dự đoán:

$\hat{y} = wx + b$

Trong đó:

$x$ : giá trị đầu vào
$w$ : hệ số thể hiện mức độ ảnh hưởng của $x$
$b$ : hệ số dịch (bias), giúp đường thẳng điều chỉnh vị trí
$\hat{y}$ : giá trị dự đoán của mô hình

Bạn có thể hình dung:

$w$ là độ dốc
$b$ là điểm cắt trục tung

Mục tiêu của mô hình: học $w$ và $b$ sao cho sai số giữa $\hat{y}$ và $y$ thật nhỏ.

Giải thích theo trực quan

Ví dụ dự đoán điểm số theo số giờ học:

Giờ học tăng → điểm tăng → mô hình học được $w > 0$
Dù không học gì bạn vẫn có một mức điểm cơ bản → đó là vai trò của $b$

Đường thẳng $\hat{y} = wx + b$ mô tả mối quan hệ tăng/giảm giữa hai đại lượng.

Ví dụ thực tế

Bài toán dự đoán giá nhà theo diện tích

Nếu mô hình học được:

$w = 15$
$b = 200$

thì công thức dự đoán:

$\hat{y} = 15x + 200$

Nếu căn hộ rộng 50 m²:

$\hat{y} = 15 \cdot 50 + 200 = 950$

Góc nhìn dự án AI/ML

Trong thực tế:

Dữ liệu nên được chuẩn hóa để tránh việc một feature làm lệch $w$
Với nhiều đặc trưng, công thức mở rộng thành:
$\hat{y} = w_1 x_1 + w_2 x_2 + \dots + w_n x_n + b$
$w$ và $b$ được tối ưu bằng Gradient Descent (kiến thức quan trọng của optimization)

Linear Regression là nền tảng của Logistic Regression và các tầng tuyến tính trong Deep Learning.

Liên hệ kiến thức nền AIO

Công thức này kết nối trực tiếp với:

Đại số tuyến tính (Module 1–2)
ETL & xử lý dữ liệu (Module 3)
Regression – Classification (Module 4)
Optimization & Loss Functions (Module 5)

Nhờ hiểu rõ nền tảng, việc học DL sau này dễ dàng hơn.

Lời khuyên cho người mới

Bạn có thể thử:

Thay đổi $w$ để quan sát độ dốc đường thẳng
Thay đổi $b$ để xem đường thẳng dịch lên/xuống
Tự vẽ vài điểm và ước lượng đường thẳng phù hợp nhất

Các thử nghiệm nhỏ giúp bạn “thấm” công thức một cách tự nhiên.

Hỏi đáp nhanh về chủ đề Linear Regression

Q: Linear Regression có phải luôn là đường thẳng không?
A: Đúng với mô hình cơ bản. Nhưng nếu bạn thêm đặc trưng bậc hai, bậc ba… mô hình có thể biểu diễn quan hệ phi tuyến.

Q: Vì sao cần chuẩn hóa dữ liệu trước khi học?
A: Vì các feature có thang đo rất khác nhau sẽ làm Gradient Descent hội tụ chậm hoặc không ổn định.

Q: Dấu mũ trong $\hat{y}$ có nghĩa là gì?
A: Nó chỉ ra rằng đây là giá trị dự đoán, không phải giá trị thật.

Q: Linear Regression có thể dùng cho phân loại không?
A: Không trực tiếp, nhưng Logistic Regression được xây dựng từ nền tảng của Linear Regression.

FAQ về chương trình AIO

Q1. Con số 0 thì học nổi không?
Ans: Chỉ cần bạn có thời gian học. Điều quan trọng nhất không phải giỏi hay không, mà là có học đều mỗi ngày. Kiến thức – tài liệu – môi trường đã có team lo. Nếu bạn không có thời gian thì nên cân nhắc.

Q2. Ai dạy AIO?
Ans: Đội admin dạy toàn bộ. Admin trực tiếp hướng dẫn và hỗ trợ mọi câu hỏi của bạn trong suốt quá trình học.

Q3. Admin có “xịn” không?
Ans: Admin đều là người làm nghề thật, mỗi người một cách dạy. Quan trọng là bạn cảm thấy hợp cách truyền đạt. Admin không dám nói xịn, chỉ dạy bằng hết sức.

Q4. AIO có gì khác những nơi khác?
Ans: AIO tập trung vào nền tảng – thực hành – kèm cặp. Không chạy theo trào lưu, không nhồi quá nhanh. Mục tiêu là giúp bạn học chắc và làm được.

Tài nguyên học AI:

Chương trình AIO (https://aivietnam.edu.vn/course)
Bài viết & tài liệu học AI (https://aioconquer.aivietnam.edu.vn/)
Tutorial (https://tutorial.aivietnam.edu.vn/)