Tích hợp Mô hình Cục bộ với OpenClaw
Giới thiệu
Việc tích hợp OpenClaw, một framework tự động hóa crawler và Agent, với các mô hình lớn được triển khai cục bộ thông qua Ollama, chủ yếu dựa vào khả năng cung cấp API tương thích OpenAI của Ollama. Vì OpenClaw thường được thiết kế để hỗ trợ giao thức OpenAI, nên bạn chỉ cần cấu hình nó để trỏ đến dịch vụ Ollama cục bộ là được.
Giai ...
Đăng vào ngày 16 tháng 6 lúc 03:02
Hệ thống hội thoại giọng nói thời gian thực chạy hoàn toàn tại máy: Hướng dẫn triển khai và tối ưu với Talkio
Việc xây dựng một hệ thống AI có thể nghe, hiểu và phản hồi bằng giọng nói ngay trên thiết bị cục bộ đang trở thành hiện thực nhờ các dự án mã nguồn mở. Một trong những giải pháp tiêu biểu là llt22/talkio — công cụ cho phép bạn tương tác bằng giọng nói trực tiếp với mô hình ngôn ngữ lớn (LLM) mà không cần gửi dữ liệu ra ngoài server.
Kiến trúc ...
Đăng vào ngày 7 tháng 6 lúc 03:47
Ứng Dụng Đơn Mô Hình LLM Cho Hệ Thống RAG Toàn Diện
Bài viết này bắt nguồn từ một nhiệm vụ học tập tôi giao cho thực tập sinh vài ngày trước: sử dụng cơ chế suy luận ollama để triển khai một hệ thống RAG nhẹ nhàng trên máy tính cục bộ.
Khi kiểm tra kết quả, cuộc hội thoại sau đã diễn ra:
"Anh đã sử dụng mô hình embedding nào?"
"Mistral-nemo"
"Vậy mô hình embedding thì sa ...
Đăng vào ngày 6 tháng 6 lúc 22:06
Sử dụng mô hình Phi-3-mini cho sàng lọc hồ sơ ứng viên thông minh
Tối ưu quy trình tuyển dụng với AI: Hệ thống đánh giá hồ sơ tự động
Mùa tuyển dụng đến, khối lượng hồ sơ dồn về khiến bộ phận nhân sự rơi vào tình trạng quá tải. Việc duyệt hàng trăm CV mỗi ngày không chỉ tốn thời gian mà còn dễ bỏ sót ứng viên tiềm năng. Phương pháp truyền thống dựa trên từ khóa thường thiếu linh hoạt và không phản ánh đúng n ...
Đăng vào ngày 3 tháng 6 lúc 01:18
Java với LangChain4j: Xây dựng ứng dụng AI cục bộ trong vài phút
Giả sử bạn đang phát triển một hệ thống hỗ trợ nội bộ cho công ty — nơi nhân viên có thể hỏi bằng tiếng Việt như "Cách khôi phục mật khẩu tài khoản?" và nhận ngay câu trả lời chính xác được trích xuất từ tài liệu sản phẩm, quy trình IT hoặc cơ sở tri thức nội bộ. Không cần GPU đắt đỏ, không cần dịch vụ đám mây trả phí, cũng chẳng cần chuyển san ...
Đăng vào ngày 27 tháng 5 lúc 15:32
Chiến Lược Phát Triển Sản Phẩm AI: Bài Học Từ Thực Tiễn Triển Khai
Trải qua hai năm chuyển đổi số cho sản phẩm hiện có và phát triển sản phẩm AI gốc từ đầu, nhóm kỹ thuật đã gặp nhiều thách thức đáng kể. Dưới đây là tổng hợp kinh nghiệm thực tế.
1. Góc độ sản phẩm
1.1 Tích hợp vào quy trình làm việc sẵn có
Việc thuyết phục người dùng nội bộ chấp nhận công cụ mới đã khó, chưa nói đến việc yêu cầu khách hàng c ...
Đăng vào ngày 24 tháng 5 lúc 15:23
local-packet-whisperer: Công cụ phân tích gói tin mạng cục bộ với AI
Giới thiệu dự án
local-packet-whisperer (LPW) là một dự án mã nguồn mở sử dụng Ollama, Streamlit và PyShark, cho phép người dùng tương tác với các tệp PCAP/PCAPNG theo cách riêng tư và cục bộ. Dự án này kết hợp mô hình học máy với phân tích gói tin mạng, cung cấp giao diện người dùng thân thiện để người dùng có thể dễ dàng đặt câu hỏi và phân ...
Đăng vào ngày 18 tháng 5 lúc 21:38
Hướng dẫn triển khai maxkb và ollama bằng Docker trên môi trường Windows
Trong bài viết này, chúng tôi sẽ hướng dẫn chi tiết cách triển khai hai công cụ — maxkb và ollama — sử dụng Docker trên môi trường Windows. Bài viết này phù hợp cho những ai muốn nhanh chóng triển khai, kiểm thử và triển khai các dịch vụ này trên máy cục bộ. Do sự khác biệt giữa môi trường Windows và Linux, bài viết cũng bao gồm hướng dẫn cấu h ...
Đăng vào ngày 17 tháng 5 lúc 09:41