LIME và Anchor có mục đích gì trong XAI (Explainable AI)?

Mở đầu – Vì sao nhiều bạn thấy khó hiểu khi nghe đến LIME và Anchor?

Khi làm việc với mô hình Machine Learning hoặc Deep Learning, đặc biệt các mô hình “hộp đen” như tree ensemble, CNN, Transformer…, một câu hỏi thường xuất hiện:

“Mô hình đưa ra kết quả nhưng dựa vào điều gì để quyết định?”

Đây là lúc XAI (Explainable AI) trở thành một phần quan trọng.
Trong nhóm công cụ giải thích phổ biến nhất, LIME và Anchor là hai phương pháp thường được nhắc đến trong các bài học liên quan đến XAI – nhóm kiến thức thường xuất hiện ở Machine Learning (Module 4) và Pre-Deep Learning (Module 5) trong lộ trình học thuật nền tảng.

Cả hai đều trả lời câu hỏi:

“Mô hình dựa trên những đặc trưng nào?”
“Nếu thay đổi đặc trưng này, kết quả có đổi không?”

Nhưng cách tiếp cận thì khác nhau.

Cốt lõi – LIME và Anchor dùng để làm gì?

LIME: Giải thích cục bộ dựa trên mô hình tuyến tính

Mục đích chính:
→ Giải thích một dự đoán cụ thể bằng cách tìm các đặc trưng quan trọng xung quanh điểm đó.

LIME làm gì?

Lấy mẫu quanh dữ liệu cần giải thích
Tạo ra các biến thể “giống” dữ liệu thật
Quan sát xem mô hình phản ứng ra sao
Khớp một mô hình tuyến tính đơn giản vào vùng lân cận
Trả về xem đặc trưng nào đóng góp bao nhiêu

Ý nghĩa:
LIME cho thấy tại sao mô hình dự đoán như vậy, nhưng chỉ đúng ở vùng gần điểm cần giải thích, không đại diện cho toàn bộ mô hình.

Ví dụ:
Bạn đưa ảnh vào mô hình phân loại chó/mèo.
LIME có thể nói:

Phần tai → +0.35
Màu lông → +0.22
Hình dạng mắt → +0.18

Tức là các vùng ảnh đó ảnh hưởng mạnh đến quyết định của mô hình cho riêng bức ảnh này.

Anchor: Giải thích bằng quy tắc ổn định (high-precision rules)

Mục đích chính:
→ Tìm ra một bộ điều kiện “neo” (anchor) đủ mạnh để cố định kết quả của mô hình.

Nếu các điều kiện đó giữ nguyên, mô hình gần như chắc chắn vẫn đưa ra cùng một dự đoán.

Anchor làm gì?

Tìm ra tập các rule dạng:
“Nếu đặc trưng A đúng và đặc trưng B đúng → kết quả rất ổn định”
Đảm bảo rule có độ chính xác cao (precision gần 1)
Giải thích theo kiểu logic → dễ hiểu, dễ đọc, phù hợp môi trường doanh nghiệp và kiểm toán

Ví dụ:
Trong hệ thống phát hiện spam:

“Nếu email chứa từ free và có ≥ 2 đường link → mô hình gần như luôn dự đoán spam.”

Không giải thích toàn bộ mô hình, nhưng đưa ra “điều kiện đủ mạnh” để người dùng hiểu cách mô hình hoạt động.

Khác nhau giữa LIME và Anchor – nhìn từ góc độ dự án

Khía cạnh	LIME	Anchor
Mục đích	Giải thích cục bộ bằng mô hình tuyến tính	Giải thích bằng rule rõ ràng, ổn định
Kiểu giải thích	Liệt kê đặc trưng quan trọng	Đưa ra điều kiện logic mang tính đảm bảo
Ứng dụng	Ảnh, văn bản, tabular	Phù hợp tabular, văn bản, audit
Tính ổn định	Có thể biến động	Rất ổn định khi rule thỏa mãn
Dùng khi	Cần hiểu mức độ đóng góp từng đặc trưng	Cần các điều kiện có nghĩa rõ ràng để giải thích cho quản lý

Trong thực tế, nhiều dự án dùng cả hai:

LIME → để xem mô hình chú ý vào đâu
Anchor → để tạo quy tắc “cố định”, giúp giải thích rõ ràng cho người không chuyên

Ví dụ thực tế trong doanh nghiệp

Trường hợp 1: Tín dụng ngân hàng

LIME cung cấp mức độ ảnh hưởng:

Thu nhập: +0.45
Tuổi: +0.22
Lịch sử vay: +0.31

→ Giúp nhân viên hiểu dữ liệu nào làm tăng xác suất được duyệt.

Anchor có thể đưa ra rule:

“Nếu khách hàng có lịch sử vay tốt và thu nhập > mức X → mô hình gần như luôn dự đoán đủ điều kiện.”

→ Dễ trình bày trong cuộc họp tuân thủ.

Trường hợp 2: Phân loại văn bản

LIME: highlight các từ tác động mạnh
Anchor: trả về rule dạng “Nếu chứa từ A và B → gần như luôn thuộc lớp X”

Liên hệ kiến thức nền tảng AI

LIME và Anchor liên quan đến nhóm chủ đề:

Machine Learning cơ bản (Module 4): phân loại, độ quan trọng đặc trưng
XAI Series: các kỹ thuật giải thích mô hình hộp đen
Pre-Deep Learning (Module 5): tối ưu hóa, cách mô hình phản hồi trước thay đổi đầu vào
NLP & CV (Module 9–10): vì LIME được dùng nhiều trong ảnh & văn bản

Việc hiểu hai phương pháp này rất hữu ích khi triển khai mô hình cho môi trường doanh nghiệp – nơi yêu cầu tính minh bạch cao.

Lời khuyên cho người mới tiếp cận XAI

Hãy bắt đầu với LIME để làm quen, vì trực quan và dễ hình dung
Khi cần giải thích rõ ràng dạng “logic rule”, hãy thử Anchor
Bạn có thể thử nghiệm thêm một vài trường hợp để so sánh độ ổn định giữa hai kỹ thuật
Chú ý rằng hai phương pháp đều mang tính cục bộ, không đại diện cho toàn bộ mô hình

Hỏi đáp nhanh về LIME và Anchor

Q1. LIME có giải thích toàn bộ mô hình không?
A: Không, chỉ giải thích dự đoán cục bộ cho một điểm.

Q2. Anchor có phải luôn chính xác 100% không?
A: Không bắt buộc, nhưng thường yêu cầu precision rất cao.

Q3. LIME có dùng được cho ảnh không?
A: Có, và thường được dùng để highlight vùng ảnh quan trọng.

Q4. Anchor có thể tạo nhiều rule một lúc không?
A: Có, nhưng thường ưu tiên rule ngắn, dễ hiểu.

Hỏi đáp nhanh về chương trình AIO

(giữ nguyên nội dung theo yêu cầu)

Q: Mình con số 0 thì học nổi không?
A: Chỉ cần có thời gian học mỗi ngày. Kiến thức và tài liệu team admin lo.

Q: Ai dạy AIO?
A: Toàn bộ admin AIO trực tiếp dạy và hỗ trợ trong suốt hành trình.

Q: Admin có “xịn” không?
A: Admin đều là người làm nghề thật. Không dám nói xịn, chỉ dạy bằng hết sức mình.

Q: AIO khác gì trung tâm khác?
A: AIO không phải trung tâm. Đây là dự án học tập cộng đồng với tinh thần “Cùng nhau học – cùng nhau khổ – cùng nhau lớn”.