Tích hợp LangChain4j với Spring Boot
1. Chuẩn bị ban đầu
1.1. Tạo dự án và cấu hình pom
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 https://maven.apache.org/xsd/maven ...
Đăng vào ngày 3 tháng 7 lúc 19:35
Hỗ trợ Klien Agent Đa Lượt: Token Streaming và Gọi Công cụ trong NVIDIA Dynamo
Tương tác Agent Đa Lượt và Nhu cầu từ Phía Klien
Một tương tác agent hoàn chỉnh đòi hỏi việc duy trì thông tin phiên có cấu trúc. Mỗi lượt của trợ lý (assistant) thường xen kẽ giữa "suy luận" (reasoning) và một hoặc nhiều lời gọi công cụ (tool call). Lượt người dùng (user) tiếp theo sẽ điền các kết quả công cụ tương ứng vào ngữ cảnh của mô hình ...
Đăng vào ngày 3 tháng 7 lúc 18:32
Công cụ Ollama cho mô hình ngôn ngữ lớn
Ollama hiện là công cụ phổ biến nhất để chạy các mô hình ngôn ngữ lớn (LLM) trên máy cục bộ, hỗ trợ Windows, macOS và Linux.
1. Cài đặt nhanh
a. Windows / macOS
Tải về: Truy cập trang web ollama.com để tải gói cài đặt.
Windows: Chạy trực tiếp tệp .exe, dịch vụ sẽ tự động khởi động sau khi cài đặt.
macOS: Kéo thả biểu tượng từ .dmg vào thư mục ...
Đăng vào ngày 3 tháng 7 lúc 11:55
Hệ thống Quản lý Bộ nhớ và Ngữ cảnh trong OpenClaw
Trong phiên bản OpenClaw 2026, khả năng quản lý bộ nhớ và ngữ cảnh (Memory & Context) là yếu tố then chốt tạo nên sự khác biệt so với các chatbot thông thường. Thay vì chỉ lưu trữ lịch sử trò chuyện đơn giản, OpenClaw sử dụng một hệ thống tri thức phân lớp, cho phép truy xuất và tùy chỉnh logic linh hoạt.
Kiến trúc bộ nhớ của OpenClaw được ...
Đăng vào ngày 3 tháng 7 lúc 02:28
Xử lý lỗi và theo dõi quá trình phát triển LLM
Xử lý lỗi và theo dõi quá trình phát triển LLM
Trong bài viết này, chúng ta sẽ thảo luận về hai vấn đề thực tế khi làm việc với mô hình ngôn ngữ lớn (LLM). Đầu tiên, cách xử lý các lỗi có thể xảy ra khi gọi API OpenAI. Thứ hai, cách sử dụng các công cụ ghi nhật ký để giám sát quá trình chạy ứng dụng LLM.
Xử lý lỗi khi sử dụng API OpenAI
Khi ...
Đăng vào ngày 20 tháng 6 lúc 23:36
Các Kỹ Thuật Tối Ưu Hóa Mô Hình Ngôn Ngữ Lớn (LLM) Bằng Python
Các Kỹ Thuật Tối Ưu Hóa Mô Hình Ngôn Ngữ Lớn (LLM) Bằng Python
Với sự phát triển nhanh chóng của công nghệ trí tuệ nhân tạo, các mô hình ngôn ngữ lớn (LLM) đã được ứng dụng rộng rãi trong nhiều lĩnh vực như xử lý ngôn ngữ tự nhiên, tạo văn bản và hệ thống hội thoại. Tuy nhiên, những mô hình này thường có số lượng tham số khổng lồ và yêu cầu tín ...
Đăng vào ngày 20 tháng 6 lúc 19:51
Kiến trúc Model I/O trong Framework LangChain
Tổng quan về quy trình Model I/O
Trong hệ sinh thái LangChain, việc tương tác với các mô hình ngôn ngữ được chuẩn hóa thông qua quy trình Model I/O. Quy trình này bao gồm ba giai đoạn chính:
Định dạng (Format): Sử dụng Prompt Templates để xây dựng đầu vào linh hoạt.
Dự đoán (Predict): Kết nối và gọi các mô hình ngôn ngữ (LLMs hoặc Chat ...
Đăng vào ngày 20 tháng 6 lúc 11:19
LangChain: Xây dựng ứng dụng với mô hình ngôn ngữ lớn
LangChain là một framework mã nguồn mở hỗ trợ phát triển ứng dụng được điều khiển bởi mô hình ngôn ngữ lớn (LLM). Nó cung cấp các thành phần có thể tái sử dụng, tích hợp hệ sinh thái phong phú và giúp giảm đáng kể lượng code mẫu khi xây dựng ứng dụng LLM.
Vòng đời ứng dụng LLM với LangChain
Phát triển: Sử dụng các khối xây dựng sẵn như prom ...
Đăng vào ngày 18 tháng 6 lúc 20:37
Tích hợp Mô hình Cục bộ với OpenClaw
Giới thiệu
Việc tích hợp OpenClaw, một framework tự động hóa crawler và Agent, với các mô hình lớn được triển khai cục bộ thông qua Ollama, chủ yếu dựa vào khả năng cung cấp API tương thích OpenAI của Ollama. Vì OpenClaw thường được thiết kế để hỗ trợ giao thức OpenAI, nên bạn chỉ cần cấu hình nó để trỏ đến dịch vụ Ollama cục bộ là được.
Giai ...
Đăng vào ngày 16 tháng 6 lúc 03:02
Xử lý văn bản dài trong hệ thống AI Agent: Chiến lược phân tầng và tối ưu hóa hiệu suất
Đây là bài chia sẻ kinh nghiệm thực tiễn từ dự án taskFlow, tập trung vào cách xử lý thông tin đầu ra dài từ các công cụ (tool) trong kiến trúc Agent dựa trên mô hình ngôn ngữ lớn (LLM). Giải pháp được xây dựng nhằm cân bằng giữa độ chính xác, chi phí tính toán và khả năng mở rộng — đặc biệt khi làm việc với mã nguồn, tài liệu kỹ thuật hoặc ph ...
Đăng vào ngày 14 tháng 6 lúc 23:22