Nội dung bài viết
© 2025 AI VIET NAM. All rights reserved.
Tác giả: AI VIET NAM (AI VIET NAM)
Keywords: sgd vs bgd, mini-batch gradient descent, tối ưu logistic regression, gradient descent các loại
Khi bắt đầu tối ưu mô hình Logistic Regression, bạn sẽ gặp ngay ba thuật ngữ có vẻ “na ná”:
BGD – Batch Gradient Descent,
SGD – Stochastic Gradient Descent,
Mini-batch Gradient Descent.
Nhiều bạn dễ nhầm vì bản chất chúng đều cập nhật trọng số bằng cách “đi theo hướng giảm mất mát”. Nhưng sự khác biệt quan trọng nằm ở lượng dữ liệu được dùng trong mỗi lần tính gradient — một phần kiến thức then chốt trong Module 5 của chương trình học thuật AIO.
👉 Điểm mấu chốt:
Khác biệt nhỏ này dẫn đến thay đổi lớn về tốc độ, độ nhiễu và độ ổn định của quá trình tối ưu.
Tất cả biến thể GD đều dựa trên cập nhật cơ bản:
Trong đó:
Khác nhau giữa BGD, SGD và Mini-batch GD chỉ nằm ở cách tính .
Sử dụng toàn bộ tập dữ liệu để tính gradient cho mỗi bước cập nhật.
Khi dataset nhỏ và bạn muốn sự ổn định cao.
Mỗi lần cập nhật chỉ dùng 1 mẫu dữ liệu.
Dùng một nhóm nhỏ, ví dụ 16, 32, 64 mẫu.
Hầu hết mọi bài toán thực tế, từ Logistic Regression → CNN → Transformer.
Giả sử bạn có 1.000 mẫu:
Lựa chọn kiểu GD ảnh hưởng đến:
Ví dụ:
Bạn sẽ gặp ba biến thể GD trong:
Kết nối các module giúp hiểu rõ tại sao batch size quan trọng.
Q: Ba phương pháp khác nhau ở điểm nào?
A: Chỉ khác ở lượng dữ liệu dùng để tính gradient.
Q: Tại sao SGD bị nhiễu?
A: Vì gradient dựa trên 1 mẫu → không đại diện toàn bộ dữ liệu.
Q: Vì sao Mini-batch GD phổ biến nhất?
A: Vì cân bằng giữa tốc độ và độ ổn định, đồng thời tận dụng GPU tốt.
Q: Batch size bao nhiêu là phù hợp?
A: Thử nghiệm: 16–32–64–128. Không có con số cố định, tùy bài toán và GPU.
Q1. Con số 0 thì học nổi không?
Ans: Chỉ cần bạn có thời gian học. Điều quan trọng nhất không phải giỏi hay không, mà là có học đều mỗi ngày. Kiến thức – tài liệu – môi trường đã có team lo. Nếu bạn không có thời gian thì nên cân nhắc.
Q2. Ai dạy AIO?
Ans: Đội admin dạy toàn bộ. Admin trực tiếp hướng dẫn và hỗ trợ mọi câu hỏi của bạn trong suốt quá trình học.
Q3. Admin có “xịn” không?
Ans: Admin đều là người làm nghề thật, mỗi người một cách dạy. Quan trọng là bạn cảm thấy hợp cách truyền đạt. Admin không dám nói xịn, chỉ dạy bằng hết sức.
Q4. AIO có gì khác những nơi khác?
Ans: AIO không phải trung tâm. Đây là dự án học tập cộng đồng, được cải tiến qua từng khóa. Tinh thần của AIO: Cùng nhau học – cùng nhau khổ – cùng nhau lớn. Nếu hợp tinh thần đó, bạn sẽ thấy phù hợp.