Nội dung bài viết
© 2025 AI VIET NAM. All rights reserved.
Tác giả: AI VIET NAM (AI VIET NAM)
Keywords: vector database, RAG, Chroma, FAISS, semantic search, embedding
Khi bắt đầu tìm hiểu RAG (Retrieval-Augmented Generation), rất nhiều bạn có chung một câu hỏi:
“Tại sao phải dùng Vector Database? Không dùng file hay list bình thường được không?”
Sự nhầm lẫn xuất phát từ việc RAG có hai phần:
Retrieval (tìm kiếm) và Generation (tạo nội dung).
Trong đó, phần Retrieval hoạt động dựa trên việc so khớp ngữ nghĩa, chứ không dựa trên từ khóa.
Vì vậy, cách lưu trữ và tìm kiếm phải phù hợp với ý nghĩa của văn bản – điều mà Vector Database làm rất tốt.
Các hệ như Chroma hoặc FAISS xuất hiện để giải quyết đúng nhu cầu này.
Mỗi đoạn văn được chuyển về một vector (
embeddingĐiều này liên quan đến nhóm kiến thức Module NLP – Embedding & Tokenization (Module 10).
Thay vì tìm trùng từ khóa, Vector Database tìm những đoạn giống về ý nghĩa.
Ví dụ:
Query: “cách nấu phở nhanh”
Vector DB có thể trả về các đoạn nói về “thời gian chế biến phở”, dù không chứa chữ nhanh.
Đây là lý do RAG trả kết quả có chiều sâu hơn so với tìm kiếm truyền thống.
Các hệ như FAISS, Annoy, HNSWlib… dùng các cấu trúc đặc biệt (IVF, HNSW) để:
FAISS, chẳng hạn, được tối ưu mạnh trong các dự án lớn hoặc yêu cầu tốc độ cao.
Nếu không dùng Vector DB:
Vector DB giúp chọn đúng vài đoạn quan trọng nhất để đưa vào prompt, tiết kiệm chi phí và tránh prompt quá dài.
Trong triển khai thực tế (liên quan kiến thức MLOps ở các module ML/DL):
Vector DB đóng vai trò là “trung tâm lưu trữ” xuyên suốt pipeline, giúp mô hình dẫn chứng chính xác từ dữ liệu gốc.
Giả sử bạn xây dựng hệ thống “trả lời tự động dựa trên tài liệu nội bộ”.
Tài liệu PDF: 2000 trang
Mỗi trang được chia thành nhiều chunk
Tạo embedding cho từng chunk
Lưu embedding vào Chroma
Khi người dùng hỏi:
“Hướng dẫn reset mật khẩu tài khoản công ty?”
Quy trình diễn ra:
Nếu không có Vector DB, việc tìm lại đoạn phù hợp trong hàng nghìn trang gần như không thể thực hiện nhanh.
Ở các pipeline dạng chatbot nội bộ, trợ lý tri thức, hoặc tìm kiếm semantic, Vector DB là thành phần không thể thiếu:
Lựa chọn công nghệ thường phụ thuộc:
Giống cách cấu trúc dữ liệu và ETL trong Module 3, Vector DB là nơi “giữ cấu trúc vector hóa” để mọi bước sau vận hành mượt.
Kiến thức liên quan đến Vector Database và RAG trải dài các module:
Đây là nhóm kiến thức mà người học AI thường đi qua trước khi tự xây RAG pipeline.
Giữ tư duy đơn giản:
Bạn có thể thử nghiệm một project nhỏ để quan sát rõ hơn cách retrieval hoạt động.
Q1: Không dùng Vector Database thì có làm RAG được không?
A: Có thể, nhưng tốc độ chậm và không tối ưu.
Q2: FAISS có phải là database đầy đủ không?
A: FAISS là thư viện tìm kiếm vector, không phải DB truyền thống.
Q3: Chroma có phù hợp dự án nhỏ không?
A: Có, vì cài đặt và dùng khá đơn giản.
Q4: Vector Database có thay thế được SQL/NoSQL không?
A: Không, vì nó chỉ xử lý embedding và tìm kiếm ngữ nghĩa.
Q: Mình con số 0 thì học nổi không?
A: Chỉ cần có thời gian học mỗi ngày. Kiến thức và tài liệu team admin lo.
Q: Ai dạy AIO?
A: Toàn bộ admin AIO trực tiếp dạy và hỗ trợ trong suốt hành trình.
Q: Admin có “xịn” không?
A: Admin đều là người làm nghề thật. Không dám nói xịn, chỉ dạy bằng hết sức mình.
Q: AIO khác gì trung tâm khác?
A: AIO không phải trung tâm. Đây là dự án học tập cộng đồng với tinh thần “Cùng nhau học – cùng nhau khổ – cùng nhau lớn”.