Nội dung bài viết
© 2025 AI VIET NAM. All rights reserved.
Tác giả: AI VIET NAM (AI VIET NAM)
Keywords: lambda xgboost, regularization l2, leaf weight, overfitting xgboost, machine learning
Khi bắt đầu tinh chỉnh XGBoost, nhiều bạn thường gặp một tham số gây tò mò: λ (lambda).
Câu hỏi phổ biến nhất là:
“Lambda trong XGBoost dùng để làm gì?
Tại sao mô hình lại cần thêm nó khi đã có nhiều tham số kiểm soát độ phức tạp?”
Thắc mắc này hoàn toàn hợp lý, vì XGBoost là mô hình mạnh nhưng cũng dễ bị quá khớp nếu không có cơ chế kiểm soát.
Lambda nằm trong nhóm regularization của XGBoost — gắn trực tiếp với kiến thức ML & Optimization ở Module 4–5 của AIO.
XGBoost sử dụng hàm mục tiêu gồm:
Hai tham số regularization chính:
Trong thực tế, lambda được dùng nhiều hơn vì có tác dụng làm ổn định quá trình học.
Trong mỗi cây:
Ý nghĩa:
Rất giống với Ridge Regression (L2) trong ML cơ bản.
Mỗi cây trong Gradient Boosting cố gắng sửa lỗi của cây trước.
Điều này dễ dẫn đến:
→ overfitting mạnh.
Lambda kìm hãm điều này.
Lambda làm loss “phẳng hơn”, giúp mô hình:
Điều này gắn chặt với kiến thức optimization trong Module 5.
Với dữ liệu tabular lớn:
Lambda giúp tránh việc một vài feature đẩy leaf weight quá mạnh.
Bạn có thể xem lambda như núm xoay “mức độ ổn định của mô hình”.
Bài toán dự đoán giá nhà với hàng trăm đặc trưng.
Khi lambda nhỏ:
Tăng lambda:
Lambda là một trong những cách nhanh nhất để làm mô hình "điềm tĩnh" hơn.
Trong pipeline thực tế:
Bạn có thể thử:
Những thử nghiệm nhỏ sẽ giúp bạn hiểu rõ bản chất của L2 regularization trong boosting.
Q: Lambda khác gì Alpha trong XGBoost?
A: Lambda là L2, làm trơn và thu nhỏ trọng số; Alpha là L1, có khả năng triệt tiêu trọng số (sparse). XGBoost mặc định ưu tiên lambda.
Q: Khi nào nên tăng lambda?
A: Khi mô hình overfit, leaf weight quá lớn, hoặc validation score dao động.
Q: Giảm lambda có lợi gì?
A: Mô hình nhạy hơn với gradient → học mạnh hơn, nhưng dễ overfit.
Q: Lambda có ảnh hưởng đến tốc độ train không?
A: Có một chút (vì tính thêm regularization), nhưng không đáng kể so với lợi ích ổn định hóa mô hình.
Q1. Con số 0 thì học nổi không?
Ans: Chỉ cần bạn có thời gian học. Điều quan trọng nhất không phải giỏi hay không, mà là có học đều mỗi ngày. Kiến thức – tài liệu – môi trường đã có team lo. Nếu bạn không có thời gian thì nên cân nhắc.
Q2. Ai dạy AIO?
Ans: Đội admin dạy toàn bộ. Admin trực tiếp hướng dẫn và hỗ trợ mọi câu hỏi của bạn trong suốt quá trình học.
Q3. Admin có “xịn” không?
Ans: Admin đều là người làm nghề thật, mỗi người một cách dạy. Quan trọng là bạn cảm thấy hợp cách truyền đạt. Admin không dám nói xịn, chỉ dạy bằng hết sức.
Q4. AIO có gì khác những nơi khác?
Ans: AIO không phải trung tâm. Đây là dự án học tập cộng đồng, được cải tiến qua từng khóa. Tinh thần của AIO: Cùng nhau học – cùng nhau khổ – cùng nhau lớn. Nếu hợp tinh thần đó, bạn sẽ thấy phù hợp.