Tổng hợp các kỹ thuật RAG hiện đại nhất 2025
2026-01-31
Dưới đây là danh sách những kỹ thuật RAG mạnh mẽ nhất mà đội ngũ của mình thường áp dụng:

Các nhóm kỹ thuật
🌱 FOUNDATIONAL RAG
1. Simple RAG Cách tiếp cận cơ bản nhất dành cho người mới — truy hồi rồi đưa cho LLM trả lời. Implementation: chạy truy vấn đơn giản + incremental learning. 2. Simple RAG using a CSV file Dùng CSV để tạo hệ thống hỏi đáp đơn giản. Implementation: embedding từ các hàng CSV + Q&A pipeline. 3. Reliable RAG Tăng độ chính xác của Simple RAG bằng validation & refinement. Implementation: kiểm tra mức liên quan + highlight đoạn được dùng để trả lời. 4. Choose Chunk Size Chọn kích thước chunk tối ưu. Implementation: thử nghiệm nhiều kích thước để cân bằng context & performance. 5. Proposition Chunking Phân rã văn bản thành factual sentences — hiệu quả cực mạnh cho hệ thống pháp luật, báo cáo, hành chính. Implementation: LLM tạo propositions → quality grading → lưu vào vectorstore.
🔍 QUERY ENHANCEMENT — Tối ưu hóa truy vấn
6. Query Transformations Rewriting, step-back prompting, sub-query decomposition. 7. Hypothetical Questions (HyDE Approach) Sinh các câu hỏi giả → cải thiện độ khớp giữa query & dữ liệu.
📚 CONTEXT & CONTENT ENRICHMENT — Làm giàu ngữ cảnh
8. Hypothetical Prompt Embeddings (HyPE) Precompute hypothetical prompts → retrieval nhanh & chính xác hơn HyDE. Không tốn chi phí LLM lúc truy vấn. 9. Contextual Chunk Headers Thêm headers cho chunk để tăng understanding. 10. Relevant Segment Extraction (RSE) Ghép nhiều chunk thành đoạn dài liên quan → cho LLM context đầy đủ. 11. Context Enrichment Techniques Embedding theo câu + lấy câu liền kề. 12. Semantic Chunking Chia theo ngữ nghĩa thay vì cố định độ dài. 13. Contextual Compression Nén chunk bằng LLM, giữ lại thông tin quan trọng. 14. Document Augmentation (Question Generation) Sinh thêm các câu hỏi liên quan cho mỗi đoạn → tăng khả năng tìm trúng.
🚀 ADVANCED RETRIEVAL — Truy hồi nâng cao
15. Fusion Retrieval Kết hợp keyword search + vector search. 16. Intelligent Reranking LLM-based scoring, cross-encoder, metadata ranking. 17. Multi-faceted Filtering Bộ lọc theo metadata, content, similarity threshold, diversity. 18. Hierarchical Indices Chỉ mục nhiều tầng: summaries → detailed chunks. 19. Ensemble Retrieval Kết hợp nhiều embedding model & nhiều thuật toán. 20. Dartboard Retrieval Tối ưu relevance + diversity cùng lúc. 21. Multi-modal Retrieval Kết hợp text + captioning + image-based retrieval.
🔁 ITERATIVE & ADAPTIVE RAG
22. Retrieval with Feedback Loops Học từ phản hồi người dùng. 23. Adaptive Retrieval Tự thay đổi chiến lược tùy truy vấn. 24. Iterative Retrieval Nhiều vòng truy hồi + follow-up queries.
📊 EVALUATION — Đánh giá chất lượng
25. DeepEval Đánh giá correctness, faithfulness, contextual relevancy. 26. GroUSE Evaluation Đo chất lượng final answer theo 6 tiêu chí nền tảng.
🔬 EXPLAINABILITY — Minh bạch hóa
27. Explainable Retrieval Giải thích rõ ràng vì sao chunk được chọn.
🏗️ ADVANCED ARCHITECTURES — Kiến trúc cao cấp
28. Agentic RAG with Contextual AI Pipeline production-ready: document parser, SOTA reranker, grounded LLM, LMUnit testing. 29. Graph RAG with Milvus Kết hợp vector search + graph relationships (triplets). 30. Knowledge Graph Integration Tích hợp dữ liệu có cấu trúc từ KG. 31. Microsoft GraphRAG Tự động phân tích corpus → tạo community graph → tăng chất lượng multi-hop QA. 32. RAPTOR Recursive Abstractive Processing → tạo cây tóm tắt nhiều tầng. 33. Self-RAG LLM tự quyết định có dùng retrieval hay không → độ chính xác cao. 34. Corrective RAG (CRAG) Hệ thống tự kiểm lỗi truy hồi → kết hợp Web Search khi cần.
🌟 SPECIAL TECHNIQUE
35. Sophisticated Controllable Agent Kỹ thuật agent tiên tiến cho bài toán phức tạp: question anonymization → planning → adaptive retrieval → multi-step reasoning → answer verification.
🔗 Full source code
Implementation đầy đủ cho 35 kỹ thuật.
github.com/NirDiamant/RAG_Techniques →
#LLM #AI #ChinhQuyenAI #genchat