Giới thiệu
Các doanh nghiệp vẫn đang xử lý thủ công những tác vụ lặp lại trên web? Giải pháp tích hợp Browser-Use và mô hình ngôn ngữ lớn (LLM) cục bộ như Gemma3 cho phép tự động hóa hoàn toàn các nhiệm vụ như thu thập dữ liệu, điền biểu mẫu, theo dõi giá cả — chỉ bằng lệnh tự nhiên, không cần viết dòng code nào. Tuy nhiên, khi triển khai nội bộ, việc quản lý từ xa gặp khó khăn do giới hạn mạng nội bộ. Giải pháp kết hợp với công cụ xuyên thủng mạng nội bộ cpolar giúp truy cập và điều khiển hệ thống từ bất kỳ đâu qua Internet, biến robot thành trợ lý ảo hoạt động 24/7.
Browser-Use sở hữu các tính năng cốt lõi: nhận diện giao diện thị giác (mô phỏng click chuột, nhập liệu), ghi âm quy trình (tạo script tự động chỉ với một cú nhấp), chống phát hiện bot (thay đổi User-Agent ngẫu nhiên, chèn khoảng dừng giữa các thao tác). Ứng dụng thực tế bao gồm: theo dõi giá đối thủ trong thương mại điện tử, khảo sát thị trường tự động, hỗ trợ khách hàng (gửi báo cáo lỗi tự động). Ưu điểm nổi bật: không cần code, hỗ trợ đa trình duyệt (Chrome, Edge, Firefox), tích hợp Ollama để chạy mô hình AI cục bộ — đảm bảo dữ liệu không bị gửi ra ngoài, an toàn tuyệt đối.
Cài đặt mô hình cục bộ bằng Ollama
Trước tiên, tải Ollama tại https://ollama.com và cài đặt trên Windows. Sau khi hoàn tất, mở terminal và chạy lệnh:
ollama run gemma3:27b
Nếu muốn thay đổi vị trí lưu trữ mô hình (mặc định là ổ C), thiết lập biến môi trường trước:
set OLLAMA_MODELS=D:\ollama
Lưu ý: đảm bảo Ollama đã được cập nhật phiên bản mới nhất để hỗ trợ đầy đủ mô hình Gemma3.
Thiết lập môi trường Python và Conda
Dự án yêu cầu Python 3.12. Trong quá trình cài đặt, nhớ tích chọn "Add Python to PATH" và "Disable path length limit" để tránh lỗi về sau. Tiếp theo, cài đặt Miniconda hoặc Anaconda — công cụ quản lý môi trường mạnh mẽ. Trong bước cài đặt, chọn tùy chọn thêm Python 3.12 vào môi trường Conda.
Triển khai Browser-Use WebUI
Tạo môi trường ảo mới:
conda create -n browseruse python=3.12
Kích hoạt môi trường:
conda activate browseruse
Sao chép mã nguồn dự án:
git clone https://github.com/browser-use/web-ui.git
cd web-ui
Cài đặt các gói phụ thuộc:
pip install -r requirements.txt
Cài đặt Playwright — thư viện tự động hóa trình duyệt:
playwright install
Tạo file cấu hình từ mẫu:
copy .env.example .env
File này cho phép tuỳ chỉnh đường dẫn trình duyệt, API key, hoặc mô hình sử dụng. Với mô hình cục bộ, bạn có thể bỏ qua và cấu hình trực tiếp trên giao diện web.
Khởi động và kiểm thử hệ thống
Chạy dịch vụ trên cổng 7788:
python webui.py --ip 127.0.0.1 --port 7788
Mở trình duyệt, truy cập http://localhost:7788 để vào giao diện người dùng.
Trên giao diện, vào phần Agent Settings, tắt tùy chọn "Visual Mode" nếu mô hình không hỗ trợ đa phương tiện. Trong LLM Settings, chọn nhà cung cấp là Ollama và nhập tên mô hình: gemma3:27b.
Thử nghiệm bằng lệnh: "Tìm kiếm 'cpolar' trên Bilibili và phát video đầu tiên". Hệ thống sẽ khởi chạy trình duyệt, thực hiện tìm kiếm và tương tác theo yêu cầu. Kết quả hiển thị rõ ràng trong cửa sổ log, đồng thời terminal cũng ghi lại từng bước xử lý.
Nếu gặp lỗi phát video do trình duyệt mặc định không hỗ trợ HTML5, hãy sửa file .env để chỉ định đường dẫn đến trình duyệt thật trên máy (ví dụ Chrome). Khi đó, cookie đăng nhập được giữ nguyên, giúp AI truy cập các trang đã đăng nhập mà không cần xác thực lại.
Xuyên thủng mạng nội bộ bằng cpolar
Để truy cập từ xa, tải cpolar tại https://www.cpolar.com, tạo tài khoản và cài đặt. Sau khi đăng nhập vào giao diện quản trị tại http://localhost:9200, tạo tunnel mới:
- Tên tunnel: buse
- Giao thức: HTTP
- Địa chỉ nội bộ: 7788
- Loại tên miền: Tên miền ngẫu nhiên
- Khu vực: China Top
Sau khi tạo, sao chép địa chỉ công cộng (public URL) và truy cập từ bất kỳ thiết bị nào có kết nối Internet — tablet, điện thoại, máy tính khác — đều có thể điều khiển hệ thống.
Thiết lập tên miền cố định
Địa chỉ ngẫu nhiên chỉ tồn tại trong 24 giờ. Để duy trì kết nối ổn định lâu dài, nâng cấp cpolar lên gói chuyên nghiệp và thiết lập tên miền con cố định:
- Vào mục Reserved trên dashboard cpolar, đăng ký tên miền con (ví dụ:
mybuse). - Quay lại tunnel
buse, chỉnh sửa: chọn Sub Domain, nhập tên đã đăng ký. - Nhấn Update để áp dụng.
Ngay lập tức, địa chỉ công cộng trở thành cố định dạng https://mybuse.cpolar.cn, dễ nhớ, dễ chia sẻ và phù hợp cho demo hoặc triển khai doanh nghiệp.
Tối ưu và bảo mật
Để tăng tính bảo mật, nên bật:
- Log hoạt động: Ghi lại mọi lệnh và thao tác thực thi.
- Danh sách trắng lệnh: Giới hạn AI chỉ thực hiện các tác vụ được định nghĩa trước (ví dụ: chỉ được phép theo dõi giá trên JD.com).
Chiến lược xử lý nhiệm vụ phức tạp: chia nhỏ yêu cầu thành nhiều bước rõ ràng (ví dụ: "1. Đăng nhập → 2. Tìm sản phẩm → 3. Chụp ảnh màn hình"). Sử dụng câu lệnh xác minh (assertion) như "Xác nhận nút ‘Thanh toán’ xuất hiện" để kiểm tra tính chính xác của quy trình.
Một đội vận hành đã ứng dụng hệ thống này để theo dõi giá đối thủ tại hội chợ triển lãm — chỉ cần gửi lệnh từ điện thoại, robot lập tức thu thập dữ liệu cạnh tranh và hỗ trợ điều chỉnh chiến lược bán hàng ngay tại chỗ, giảm thời gian phản hồi từ vài giờ xuống chưa đầy 5 phút.