Ứng Dụng Đơn Mô Hình LLM Cho Hệ Thống RAG Toàn Diện
Bài viết này bắt nguồn từ một nhiệm vụ học tập tôi giao cho thực tập sinh vài ngày trước: sử dụng cơ chế suy luận ollama để triển khai một hệ thống RAG nhẹ nhàng trên máy tính cục bộ.
Khi kiểm tra kết quả, cuộc hội thoại sau đã diễn ra:
"Anh đã sử dụng mô hình embedding nào?"
"Mistral-nemo"
"Vậy mô hình embedding thì sa ...
Đăng vào ngày 6 tháng 6 lúc 22:06