Nội dung bài viết
© 2026 AI VIET NAM. All rights reserved.
Tác giả: AI VIET NAM (AI VIET NAM)
Keywords: Levenshtein, phép biến đổi chuỗi, NLP, khoảng cách chuỗi, edit distance
Khi mới học NLP hoặc khi tiếp xúc với các phương pháp đo độ giống nhau giữa hai chuỗi, rất nhiều bạn gặp một bối rối quen thuộc:
“Levenshtein dùng bao nhiêu phép biến đổi để tính khoảng cách? Delete, insert, substitute… nhưng có thêm thao tác nào nữa không?”
Sự nhầm lẫn này thường đến từ việc có nhiều loại khoảng cách chuỗi khác nhau như Hamming, Damerau-Levenshtein, Jaro-Winkler… khiến người mới dễ trộn chúng lại.
Bài viết dưới đây giúp bạn hiểu Levenshtein đúng bản chất — gọn, đơn giản, không nặng công thức.
Khoảng cách Levenshtein đo xem hai chuỗi khác nhau bao nhiêu bằng số thao tác tối thiểu để biến chuỗi A thành chuỗi B.
Điều quan trọng nhất:
Levenshtein chỉ dùng đúng 3 phép biến đổi:
Mỗi thao tác = 1 đơn vị.
Khoảng cách = tổng số thao tác tối thiểu cần dùng.
Nhiều bạn nhầm rằng có thêm “swap ký tự”, nhưng swap chỉ thuộc Damerau-Levenshtein, không phải Levenshtein truyền thống.
CAT → CUT
BOOK → BACK
Một cách hợp lý:
→ Khoảng cách = 2
Những ví dụ này thường xuất hiện trong bài toán:
Trong dữ liệu thật, so sánh chuỗi diễn ra liên tục:
Levenshtein giúp định lượng mức độ khác biệt để xử lý hợp lý.
Thuật toán này gắn liền với nhiều nhóm kiến thức nền tảng:
Nó là “mảnh ghép nhỏ nhưng quan trọng” trong hệ thống xử lý ngôn ngữ.
Levenshtein chỉ dùng 3 phép: Insert – Delete – Substitute.
Không có swap, không reorder, không bước ẩn nào khác.
Bạn có thể thử:
Những thử nghiệm nhỏ giúp bạn nắm ý tưởng của thuật toán rõ hơn nhiều.
Levenshtein có dùng phép hoán đổi ký tự không?
Không — hoán đổi thuộc Damerau-Levenshtein, không phải Levenshtein gốc.
Tại sao Levenshtein không tính swap?
Vì định nghĩa chuẩn chỉ gồm insert, delete, substitute.
Khoảng cách càng lớn nghĩa là gì?
Nghĩa là hai chuỗi càng khác nhau nhiều.
Levenshtein có dùng cho sửa lỗi chính tả không?
Có — đây là một trong các ứng dụng phổ biến nhất.
Q1. Con số 0 thì học nổi không?
Ans: Chỉ cần bạn có thời gian học. Điều quan trọng nhất không phải giỏi hay không, mà là có học đều mỗi ngày. Kiến thức – tài liệu – môi trường đã có team lo. Nếu bạn không có thời gian thì nên cân nhắc.
Q2. Ai dạy AIO?
Ans: Đội admin dạy toàn bộ. Admin trực tiếp hướng dẫn và hỗ trợ mọi câu hỏi của bạn trong suốt quá trình học.
Q3. Admin có “xịn” không?
Ans: Admin đều là người làm nghề thật, mỗi người một cách dạy. Quan trọng là bạn cảm thấy hợp cách truyền đạt. Admin không dám nói xịn, chỉ dạy bằng hết sức.
Q4. AIO có gì khác những nơi khác?
Ans: AIO không phải trung tâm. Đây là dự án học tập cộng đồng, được cải tiến qua từng khóa. Tinh thần của AIO: Cùng nhau học – cùng nhau khổ – cùng nhau lớn. Nếu hợp tinh thần đó, bạn sẽ thấy phù hợp.