Mô hình AI vẽ tranh Tongyi Wanxiang - Công cụ tạo hình ảnh hàng đầu

Nguyên nhân sử dụng

Vì viết bài thường yêu cầu hình ảnh minh họa, việc tìm kiếm và chỉnh sửa hình ảnh truyền thống không chỉ tốn thời gian mà còn tiềm ẩn rủi ro vi phạm bản quyền. Tôi đã thử nghiệm một số công cụ tạo hình ảnh AI nổi bật sau:

Midjourney

Công cụ hàng đầu thế giới nhưng cần phần mềm trung gian để truy cập, gói dịch vụ tốt nhất có giá 30 USD/tháng, mức chi phí quá cao cho người dùng cá nhân.

Wenxin Yige

Nền tảng của Baidu với cơ chế "điện lượng" để tạo hình ảnh. Mỗi ngày người dùng nhận 40 đơn vị năng lượng, có thể nạp thêm để tăng số lượng.

Sử dụng từ khóa:

Thành phố trên trời, kết cấu trong suốt, thiết kế tỉ mỉ, 3D, render C4D, độ phân giải 8K, chi tiết vượt trội

Kết quả tạo ra mang phong cách công nghiệp hiện đại.

Tongyi Wanxiang

Mô hình AI vẽ tranh được Alipay Cloud phát triển vào ngày 7/7/2023, thuộc hệ sinh thái mô hình AI lớn "Tongyi". Với công nghệ học sâu và huấn luyện quy mô lớn, hệ thống hỗ trợ tạo hình ảnh từ văn bản (text-to-image) và chuyển đổi phong cách từ hình ảnh (image-to-image).

Mô hình dựa trên kiến trúc Composer của Alipay Cloud, phân tích chi tiết các yếu tố thiết kế như phối màu, bố cục, và tái tạo chúng theo yêu cầu. Người dùng chỉ cần nhập mô tả hoặc upload hình ảnh tham khảo để nhận kết quả chất lượng cao.

Hệ thống cung cấp 50 "điểm cảm hứng" miễn phí mỗi ngày, mỗi điểm tạo được 1 hình ảnh. Ví dụ với từ khóa:

Chú mèo trong máy giặt đang cười, phong cách sơn dầu

hoặc

Hình ảnh mèo mặc hoodie to, phong cách Disney-Pixar, quần jeans và giày vải, ánh sáng kịch tính, render Octane 8K, tỷ lệ khung hình 9:16

Giao diện API

Tongyi Wanxiang cung cấp API chính thức tại trang web Alipay Cloud, hỗ trợ lập trình Python/Java. Mức phí hiện hành là 0.16 RMB/hình ảnh, chi tiết mới nhất xem tại tài liệu định giá.

Hạn chế

Tài liệu hướng dẫn còn hạn chế, tài liệu chính thức chỉ đề cập ngắn gọn về cấu trúc câu lệnh: "đối tượng + mô tả đối tượng + phong cách mong muốn".

Thẻ: AI tạo hình ảnh mô hình Composer API hình ảnh deep learning xử lý ngôn ngữ tự nhiên

Đăng vào ngày 2 tháng 7 lúc 16:54

Thành phố Cuồng loạn