Nội dung bài viết
© 2025 AI VIET NAM. All rights reserved.
Tác giả: AI VIET NAM (AI VIET NAM)
Keywords: LightGBM vs XGBoost, tốc độ xử lý, machine learning boosting, leaf-wise, level-wise
Khi mới làm quen với các mô hình Boosting trong Machine Learning, người học thường gặp hai cái tên quen thuộc: XGBoost và LightGBM. Cả hai đều mạnh, ổn định và phổ biến trong những bài toán dạng bảng
tabularCâu hỏi tự nhiên xuất hiện:
“Cùng là Boosting, cùng là cây quyết định, vậy LightGBM nhanh hơn XGBoost ở điểm nào?”
Điều làm nhiều bạn khó phân biệt nằm ở việc cả hai đều tối ưu
hiệu quả tính toánBài viết này đi từ gốc rễ, giúp bạn hiểu lý do LightGBM xử lý nhanh hơn XGBoost mà không cần công thức nặng nề.
Đây là khác biệt quan trọng nhất.
Mỗi lần mở rộng cây, XGBoost mở toàn bộ các node ở cùng một tầng.
Ưu điểm: Cây cân đối, dễ kiểm soát.
Nhược điểm:
Mở rộng cả những nhánh “không quan trọng”, gây tốn thời gian và bộ nhớ.
kèm giới hạn độ sâuLightGBM chỉ mở rộng node có “lợi ích” cao nhất.
Tức là thay vì mở cả tầng, nó tập trung vào một nhánh “lời nhất” để đào sâu.
Ưu điểm:
Chọn đúng khu vực cần chia → tăng tốc đáng kể.
Nhược điểm:
Nếu không giới hạn độ sâu, cây có thể lệch
overfittingdepth limitBạn có thể hình dung bằng ví dụ:
Giả sử trong một tầng có 20 node:
Khi dữ liệu lớn:
=> Mức tiết kiệm thời gian càng rõ rệt.
LightGBM không duyệt từng giá trị liên tục, mà gom giá trị feature vào các
bintùy bản dùngLightGBM còn dùng:
Ghép các feature ít tương quan để giảm chiềuGradient-based One-Side SamplingƯu tiên giữ mẫu có gradient lớnCả hai đều góp phần giảm chi phí xử lý.
Tùy vào bài toán:
Trong nhóm kiến thức Machine Learning 1–2
module 4optimization module 5gradientsplit gainregularizationNếu bạn mới học Boosting, có thể:
Bạn có thể bắt đầu bằng vài thử nghiệm nhỏ để hiểu rõ hơn cách mỗi mô hình hoạt động.
LightGBM có luôn nhanh hơn XGBoost không?
Không phải lúc nào, nhưng thường nhanh hơn trên dữ liệu lớn.
LightGBM có dễ overfit hơn không?
Đúng, vì Leaf-wise dễ tạo cây lệch nếu không giới hạn độ sâu.
XGBoost có chậm hơn do Level-wise không?
Đúng, Level-wise mở rộng nhiều node không cần thiết.
Cả hai có dùng được cho regression và classification không?
Có, cả hai đều hỗ trợ nhiều loại bài toán.
4 câu được phépQ: Mình con số 0 thì học nổi không?
A: Chỉ cần có thời gian học mỗi ngày. Kiến thức và tài liệu team admin lo.
Q: Ai dạy AIO?
A: Toàn bộ admin AIO trực tiếp dạy và hỗ trợ trong suốt hành trình.
Q: Admin có “xịn” không?
A: Admin đều là người làm nghề thật. Không dám nói xịn, chỉ dạy bằng hết sức mình.
Q: AIO khác gì trung tâm khác?
A: AIO không phải trung tâm. Đây là dự án học tập cộng đồng với tinh thần “Cùng nhau học – cùng nhau khổ – cùng nhau lớn”.