Công thức dự đoán cơ bản của Linear Regression (ŷ = wx + b) là gì?

Tác giả: AI VIET NAM (AI VIET NAM)

Keywords: linear regression, công thức dự đoán, wx+b, mô hình hồi quy, machine learning

Công thức dự đoán Linear Regression

Khi mới học Machine Learning, Linear Regression thường là mô hình đầu tiên xuất hiện. Nhưng với nhiều bạn, cụm công thức “ŷ = wx + b” đôi khi tạo cảm giác trừu tượng:
w đại diện cho điều gì?
b có vai trò gì?
tại sao công thức này lại mô tả được cả một mô hình dự đoán?

Những câu hỏi này thường xuất hiện ở giai đoạn làm quen với Regression – một phần nội dung thường thấy trong nhóm kiến thức ML nền tảng. Bài viết dưới đây giúp bạn hiểu công thức dự đoán của Linear Regression theo cách dễ hình dung.

Công thức ŷ = wx + b có nghĩa là gì?

Công thức dự đoán cơ bản của Linear Regression là:

ŷ = w·x + b

Trong đó:

  • x: giá trị đầu vào (một đặc trưng hoặc nhiều đặc trưng)
  • w: hệ số (weight) mô tả mức độ ảnh hưởng của x lên dự đoán
  • b: hệ số dịch (bias), giúp đường thẳng “điều chỉnh vị trí”
  • ŷ: giá trị mà mô hình dự đoán

Bạn có thể xem w như “độ dốc”, còn b là điểm mà đường thẳng cắt trục tung. Mô hình học cách chọn w và b sao cho sai số giữa dự đoán ŷ và giá trị thật y nhỏ nhất.

Giải thích theo trực quan

Hãy tưởng tượng bạn muốn dự đoán điểm số dựa trên số giờ học:

  • Khi số giờ học tăng, điểm số có xu hướng tăng → mô hình sẽ học w > 0.
  • Nếu điểm trung bình bắt đầu từ một mức cố định nào đó, b sẽ đại diện cho mức xuất phát này.

Vậy đường thẳng ŷ = wx + b chính là cách mô hình mô tả mối quan hệ tăng/giảm giữa hai đại lượng.

Ví dụ thực tế

Bài toán dự đoán giá nhà theo diện tích

  • x = diện tích (m²)
  • ŷ = giá nhà dự đoán
  • w = hệ số cho biết diện tích tăng 1 m² thì giá tăng trung bình bao nhiêu
  • b = mức giá khởi điểm khi diện tích bằng 0 (ý nghĩa kỹ thuật, dùng để điều chỉnh đường thẳng)

Nếu mô hình học được:

  • w = 15
  • b = 200

thì công thức dự đoán là:

ŷ = 15·x + 200

Nếu căn hộ rộng 50 m²
→ dự đoán giá =

15 × 50 + 200 = 950
(đơn vị tương ứng với dữ liệu gốc).

Góc nhìn khi làm dự án AI/ML

Khi triển khai Regression trong dự án:

  • Việc chuẩn hóa dữ liệu (Min-Max, Standardization) giúp w không bị ảnh hưởng bởi khác biệt về thang đo (kiến thức thường gặp trong nhóm ETL – Module 3).
  • Nhiều đặc trưng → mô hình mở rộng thành dạng vector:
    ŷ = w₁x₁ + w₂x₂ + … + wn·xn + b
  • Tối ưu w, b thường dùng Gradient Descent – kiến thức nền trong nhóm optimization (Module 5).

Linear Regression cũng là nền tảng của:

  • Logistic Regression (phân loại)
  • Một số bước đầu của mô hình Deep Learning (Module 7–8)

Nắm vững công thức ŷ = wx + b giúp việc hiểu các kiến trúc phức tạp sau này trở nên tự nhiên hơn.

Liên hệ nhẹ đến kiến thức nền AIO

Công thức này thường gắn với các nhóm kiến thức:

  • Toán – Đại số tuyến tính (Module 1–2)
  • ETL và xử lý dữ liệu (Module 3)
  • Regression – Classification (Module 4)
  • Optimization trong Pre-Deep Learning (Module 5)

Đây là những bước nền giúp người học AI hiểu vì sao mô hình có thể học được w và b.

Lời khuyên cho người mới bắt đầu

Bạn có thể thử vẽ một vài điểm và tự phác họa đường thẳng dự đoán để “cảm” mối quan hệ giữa x và ŷ.

Thử thay đổi w, b để xem đường thẳng di chuyển như thế nào.

Có thể bắt đầu bằng những bài toán nhỏ, như dự đoán điểm số hoặc giá đơn giản, để hiểu rõ công thức này hơn.

Tài nguyên học AI: