Danh mục mô hình AI

So sánh mô hình hình ảnh, video, âm thanh và chat trước khi dùng tín dụng

Duyệt hơn 95 mô hình AI theo tác vụ, đầu vào, đầu ra, nhà cung cấp và ghi chú tín dụng. Xem từng mô hình phù hợp việc gì, xem ví dụ thật, rồi đưa danh sách rút gọn vào Rivya để thử nghiệm thực tế.
6 tín dụng khi đăng ký
Đăng ký nhanh
Hình ảnhImageVideoÂm thanhChat

Danh mục mô hình

Tìm mô hình theo tác vụ, đầu vào và đầu ra

Lọc theo loại phương thức, loại đầu vào, nhà cung cấp, điểm mạnh và ghi chú tín dụng. Mở trang mô hình để xem đầu ra thật, độ phù hợp với tác vụ và bản thử nhanh trực tuyến.

4 loại mô hình

Tất cả mô hình

Tìm theo mô hình, nhà cung cấp, năng lực hoặc tác vụ. Sau đó dùng các bộ lọc theo dữ kiện để thu hẹp trang mà không cần mở từng trang chi tiết.

95 lựa chọn mô hình

So sánh đầu vào, đầu ra, tín dụng và gợi ý ví dụ trước khi chốt danh sách rút gọn.

So sánh độ phù hợp mô hình

Lọc theo các trường Rivya đã theo dõi cho từng mô hình: phương thức và đầu vào được hỗ trợ. Độ phù hợp với tác vụ được hiển thị trên thẻ từ nguồn nội dung mô hình.

Gợi ý tín dụng

Hướng dẫn tín dụng được hiển thị trên từng thẻ mô hình từ nội dung danh mục.

Phương thức

Đầu vào được hỗ trợ

95 lựa chọn mô hình

So sánh đầu vào, đầu ra, tín dụng và gợi ý ví dụ trước khi chốt danh sách rút gọn.

4 loại mô hìnhTất cả

Mô hình tốt để bắt đầu

Bắt đầu tại đây

Alibaba

Z-Image

Hình ảnh

Mô hình text-to-image nhẹ của Alibaba. Tạo nhanh một ảnh với 5 tỷ lệ khung hình, lý tưởng cho bản nháp ý tưởng nhanh và hình ảnh mạng xã hội chỉ với 1 credit.

Vì sao chọn

Chi phí thấp nhất ở mức 1 credit cho mỗi lần tạo

Phù hợp nhất cho
Concept hình ảnh vòng đầu giá rẻ
Đầu vào
Văn bản
Đầu ra
Hình ảnh
Tín dụng
Từ 1 credit cho mỗi lần tạo
Đầu ra một ảnh nhanh cho vòng lặp tốc độ caoText-to-image gọn với 5 preset tỷ lệ khung hình

Google

Nano Banana

Image

Mô hình ảnh linh hoạt của Google cho text-to-image và image-to-image với 11 tỷ lệ khung hình, tối đa 10 ảnh tham chiếu và đầu ra PNG/JPEG. Phù hợp tốt với chân dung, bố cục sản phẩm và visual landing page khổ rộng hơn.

Vì sao chọn

11 tỷ lệ khung hình, bao gồm 21:9 siêu rộng và chế độ auto

Phù hợp nhất cho
Bố cục sản phẩm với nhiều tham chiếu thị giác
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 3 credit mỗi lần tạo
Tối đa 10 ảnh tham chiếu để dẫn hướng sáng tạoTùy chọn định dạng đầu ra PNG và JPEG

Black Forest Labs

Flux 2 Pro

Hình ảnh

Mô hình chủ lực 32B tham số của Black Forest Labs. Hỗ trợ tạo ảnh từ văn bản và tạo ảnh từ ảnh với tối đa 8 ảnh tham chiếu, độ phân giải 2K và khả năng render chữ chính xác — được xây dựng cho ảnh sản phẩm và hình ảnh thương hiệu.

Vì sao chọn

Độ phân giải tối đa 2K với chất liệu ảnh chân thực

Phù hợp nhất cho
Ảnh tĩnh sản phẩm và ảnh hero cho ecommerce
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 5 credit cho mỗi lần tạo
Render chữ và logo chính xác trong ảnhTối đa 8 ảnh tham chiếu để giữ nhất quán phong cách/nhân vật

OpenAI

GPT-5.5

Chat

Mô hình chat GPT nâng cao của OpenAI trên Rivya cho suy luận phức tạp, phân tích có nhận biết hình ảnh, tổng hợp nghiên cứu và viết có cấu trúc khi brief cần nhiều khoảng xử lý hơn.

Vì sao chọn

Trần năng lực cao cho suy luận phức tạp và phân tích nhiều bước

Phù hợp nhất cho
Tổng hợp nghiên cứu từ các gói nguồn dài hoặc lộn xộn
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng - credit dựa trên mức sử dụng
Hỗ trợ chat nhận biết hình ảnh với tối đa 6 hình ảnhPhù hợp cho brief có cấu trúc, tổng hợp nghiên cứu và viết ra quyết định

OpenAI

GPT-5.4

Chat

Mô hình chat AI cao cấp hơn của OpenAI trên Rivya, với khả năng xử lý đầu vào có cấu trúc tốt hơn, kiểm soát suy luận mạnh hơn và các dự án hội thoại thiên về công cụ cho những nhiệm vụ phân tích và viết phức tạp hơn.

Vì sao chọn

Phân tích phức tạp và lập kế hoạch nhiều bước mạnh hơn

Phù hợp nhất cho
Brief chiến lược dài và memo ra quyết định
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng — credit dựa trên mức sử dụng
Hỗ trợ thị giác với tối đa 6 hình ảnhPhù hợp cho nhiệm vụ có cấu trúc và hội thoại thiên về công cụ

OpenAI

GPT-5.4 Codex

Chat

Mô hình Codex cao cấp hơn của OpenAI trên Rivya, với năng lực lập trình mạnh hơn, suy luận có cấu trúc và cộng tác thiên về công cụ cho các dự án phát triển cấp repo đòi hỏi cao.

Vì sao chọn

Suy luận Codex và cộng tác lập trình ở tầng cao hơn

Phù hợp nhất cho
Debug cấp repo và review kiến trúc
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng — credit dựa trên mức sử dụng
Giữ dự án ResponsesPhù hợp cho code phức tạp, dùng công cụ và công việc kỹ thuật nhiều bước

OpenAI

GPT-5.3 Codex

Chat

Mô hình Codex mới nhất và mạnh nhất của OpenAI trên Rivya. Mô hình kết hợp chất lượng tạo code hiện đại với suy luận agentic sâu hơn cho những dự án phát triển đòi hỏi cao nhất.

Vì sao chọn

Mô hình code mạnh nhất của OpenAI

Phù hợp nhất cho
Debug khó trong codebase lớn
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng — credit dựa trên mức sử dụng
Chất lượng tạo code hiện đạiSuy luận sâu nhất cho vấn đề phức tạp

OpenAI

GPT-5.2

Chat

Mô hình chat AI GPT chủ lực của OpenAI trên Rivya, với suy luận nâng cao, hỗ trợ thị giác cho tối đa 6 ảnh và cửa sổ ngữ cảnh 20K ký tự. Đây là lựa chọn GPT tổng quát mạnh cho nghiên cứu, lập kế hoạch, viết và phân tích có nhận biết hình ảnh.

Vì sao chọn

Suy luận nâng cao và phân tích phức tạp

Phù hợp nhất cho
Memo chiến lược và tài liệu quyết định
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng — credit dựa trên mức sử dụng
Hỗ trợ thị giác — phân tích tối đa 6 ảnhCửa sổ ngữ cảnh 20K ký tự

OpenAI

GPT-5.2 Codex

Chat

Mô hình Codex nâng cao hơn của OpenAI trên Rivya, với suy luận mạnh hơn cho các tác vụ kỹ thuật phức tạp. Mô hình được tối ưu cho lập trình agentic dài hạn, quyết định kiến trúc và refactor lớn khi tạo code đơn thuần là chưa đủ.

Vì sao chọn

Suy luận mạnh hơn cho kỹ thuật phức tạp

Phù hợp nhất cho
Review kiến trúc và đánh đổi thiết kế hệ thống
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng — credit dựa trên mức sử dụng
Phù hợp nhất cho thiết kế hệ thống và kiến trúc12K token đầu ra cho tạo code toàn diện

OpenAI

GPT-5.1 Codex

Chat

Mô hình Codex nâng cấp của OpenAI trên Rivya, với độ chính xác code tốt hơn và suy luận mạnh hơn cho các tác vụ lập trình dạng agent. Mô hình giữ cùng dự án nhận biết repo, đầu ra dài, đồng thời cải thiện refactor nhiều file và chỉnh sửa code an toàn hơn.

Vì sao chọn

Độ chính xác code cải thiện so với GPT-5 Codex

Phù hợp nhất cho
Refactor nhiều file và migration
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng — credit dựa trên mức sử dụng
Tốt hơn cho refactor nhiều fileGiới hạn đầu ra 12K token cho tạo code dài

OpenAI

GPT-5 Codex

Chat

Mô hình GPT-5 Codex chuyên về code của OpenAI trên Rivya cho debug, lập kế hoạch triển khai, refactor và giải quyết vấn đề kỹ thuật với hỗ trợ thị giác.

Vì sao chọn

Chuyên về code với giới hạn đầu ra 12K token

Phù hợp nhất cho
Review code và sửa lỗi
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng — credit dựa trên mức sử dụng
Tối ưu cho tạo code và debugHỗ trợ thị giác để phân tích ảnh chụp màn hình/sơ đồ

Google

Gemini 3.1 Pro

Chat

Mô hình chat AI Gemini mới nhất và mạnh nhất của Google trên Rivya. Với suy luận, thị giác và khả năng tuân thủ chỉ dẫn ở cấp cao, đây là lựa chọn Gemini mạnh nhất cho các tác vụ phân tích và sáng tạo đòi hỏi cao.

Vì sao chọn

Mô hình Gemini mạnh nhất của Google

Phù hợp nhất cho
Gói nghiên cứu dài ngữ cảnh và công việc so sánh
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng — credit dựa trên mức sử dụng
Suy luận và tuân thủ chỉ dẫn cấp caoHỗ trợ thị giác với tối đa 6 ảnh

Google

Gemini 3 Pro

Chat

Mô hình chat AI Gemini có chiều sâu cao hơn của Google trên Rivya. Với suy luận mạnh hơn Gemini 2.5 Pro và hỗ trợ thị giác, mô hình này phù hợp hơn cho tổng hợp nghiên cứu, viết kỹ thuật và phân tích đa phương thức thận trọng hơn.

Vì sao chọn

Suy luận nâng cao hơn Gemini 2.5 Pro

Phù hợp nhất cho
Phân tích dài và đề xuất có cấu trúc
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng — credit dựa trên mức sử dụng
Hỗ trợ thị giác với tối đa 6 ảnhMạnh về tổng hợp nghiên cứu và viết kỹ thuật

Google

Gemini 3 Flash

Chat

Mô hình chat AI nhanh thế hệ mới của Google trên Rivya. Với chi phí token còn thấp hơn Gemini 2.5 Flash và suy luận mạnh hơn, mô hình này được xây dựng cho chat đa phương thức khối lượng lớn, phân loại ảnh chụp màn hình và công việc trợ lý tốc độ cao.

Vì sao chọn

Định giá token thấp nhất trong tất cả mô hình chat

Phù hợp nhất cho
Phân loại đa phương thức nhanh và phân tích ảnh chụp màn hình
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng — credit dựa trên mức sử dụng
Suy luận cải thiện so với Gemini 2.5 FlashHỗ trợ thị giác với tối đa 6 ảnh

Google

Gemini 2.5 Pro

Chat

Mô hình chat AI Gemini nâng cao hơn của Google trên Rivya. Với khả năng suy luận mạnh hơn Flash, hỗ trợ thị giác và ngữ cảnh 20K, mô hình này phù hợp hơn cho tổng hợp nghiên cứu, phân tích tài liệu và viết có cấu trúc ở mức 2 credit.

Vì sao chọn

Suy luận mạnh hơn Gemini Flash

Phù hợp nhất cho
Tổng hợp nghiên cứu và bài viết phân tích
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng — credit dựa trên mức sử dụng
Hỗ trợ thị giác — phân tích tối đa 6 ảnhChi phí cân bằng ở mức 2 credit cho mỗi lượt dùng

Google

Gemini 2.5 Flash

Chat

Mô hình chat AI nhanh nhất và tiết kiệm nhất của Google trên Rivya. Với mức 1 credit cho mỗi lượt dùng và hỗ trợ thị giác cho tối đa 6 ảnh, mô hình này phù hợp cho hỏi đáp nhanh, tóm tắt vòng đầu, phân loại ảnh chụp màn hình và hỗ trợ AI hằng ngày.

Vì sao chọn

Mô hình chat chi phí thấp nhất ở mức 1 credit

Phù hợp nhất cho
Tra cứu nghiên cứu nhanh và tóm tắt vòng đầu
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo lượt dùng — credit dựa trên mức sử dụng
Phản hồi nhanh cho hội thoại thời gian thựcHỗ trợ thị giác — phân tích tối đa 6 ảnh

Anthropic

Claude Opus 4.7

Chat

Mô hình chat Claude flagship của Anthropic trên Rivya cho suy luận sâu, tổng hợp cẩn trọng, viết cấp điều hành và công việc văn bản có tác động cao.

Vì sao chọn

Suy luận và tổng hợp văn bản cấp flagship

Phù hợp nhất cho
Memo điều hành và tường thuật kiểu hội đồng
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo mức dùng - credit dựa trên lượng sử dụng
Rất phù hợp cho phân tích dài và viết cẩn trọngDự án Claude ưu tiên văn bản trong front end hiện tại của Rivya

Anthropic

Claude Opus 4.6

Chat

Mô hình chat Claude AI flagship của Anthropic trên Rivya. Mô hình này được xây dựng cho suy luận sâu, phân tích phức tạp và viết chất lượng cao trong các dự án đòi hỏi cao, rủi ro lớn.

Vì sao chọn

Suy luận flagship và phân tích phức tạp

Phù hợp nhất cho
Memo điều hành và viết tường thuật rủi ro cao
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo mức dùng — credit dựa trên lượng sử dụng
Trần năng lực cao hơn cho hiểu dài và chất lượng đầu raDự án Claude ưu tiên văn bản trong front end hiện tại của Rivya

Anthropic

Claude Sonnet 4.6

Chat

Mô hình chat Claude AI cân bằng của Anthropic trên Rivya. Mô hình giữ khả năng suy luận dài mạnh và phân tích cẩn trọng cho dự án nội dung, nghiên cứu và coding mà không phải nhảy lên mức chi của Opus.

Vì sao chọn

Suy luận đáng tin cậy với chất lượng cân bằng

Phù hợp nhất cho
Review brief dài, PRD và tài liệu chiến lược
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo mức dùng — credit dựa trên lượng sử dụng
Hiểu dài mạnh và ổn định qua nhiều lượtDự án Claude ưu tiên văn bản trong front end hiện tại của Rivya

Anthropic

Claude Opus 4.5

Chat

Mô hình chat Claude AI flagship của Anthropic trên Rivya. Mô hình này xuất sắc ở suy luận sâu, phân tích phức tạp và viết ở cấp chuyên gia, là lựa chọn premium cho các tác vụ AI quan trọng.

Vì sao chọn

Mô hình mạnh nhất của Anthropic

Phù hợp nhất cho
Tổng hợp nghiên cứu sâu và phân tích khó
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo mức dùng — credit dựa trên lượng sử dụng
Suy luận sâu và phân tích phức tạp xuất sắcChất lượng nội dung và viết ở cấp chuyên gia

Anthropic

Claude Sonnet 4.5

Chat

Mô hình chat Claude AI cân bằng của Anthropic trên Rivya. Mô hình mạnh về viết tinh tế, phân tích cẩn trọng và phản hồi có ý thức an toàn, là một lựa chọn Claude vững cho sáng tạo nội dung và nghiên cứu.

Vì sao chọn

Viết tinh tế và phân tích cẩn trọng

Phù hợp nhất cho
Viết lại biên tập và viết nhạy về giọng điệu
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo mức dùng — credit dựa trên lượng sử dụng
Phản hồi có ý thức an toàn và được hiệu chỉnh tốtDự án Claude ưu tiên văn bản trong front end hiện tại của Rivya

Anthropic

Claude Haiku 4.5

Chat

Mô hình chat Claude AI nhẹ của Anthropic trên Rivya. Mô hình này được tinh chỉnh cho tốc độ, hiệu quả chi phí và hiệu suất chat hằng ngày ổn định trong các dự án tần suất cao, nơi bạn muốn giọng điệu Claude mà không cần chi premium.

Vì sao chọn

Phù hợp hơn cho sử dụng tần suất cao, độ trễ thấp

Phù hợp nhất cho
Phân loại inbox và hỏi đáp nội bộ nhanh
Đầu vào
Văn bản
Đầu ra
Văn bản / suy luận
Tín dụng
Trả theo mức dùng — credit dựa trên lượng sử dụng
Giá token rẻ hơn nhiều so với Sonnet hoặc OpusDự án Claude ưu tiên văn bản trong front end hiện tại của Rivya

Alibaba

Z-Image

Hình ảnh

Mô hình text-to-image nhẹ của Alibaba. Tạo nhanh một ảnh với 5 tỷ lệ khung hình, lý tưởng cho bản nháp ý tưởng nhanh và hình ảnh mạng xã hội chỉ với 1 credit.

Vì sao chọn

Chi phí thấp nhất ở mức 1 credit cho mỗi lần tạo

Phù hợp nhất cho
Concept hình ảnh vòng đầu giá rẻ
Đầu vào
Văn bản
Đầu ra
Hình ảnh
Tín dụng
Từ 1 credit cho mỗi lần tạo
Đầu ra một ảnh nhanh cho vòng lặp tốc độ caoText-to-image gọn với 5 preset tỷ lệ khung hình

Google

Nano Banana 2

Image

Mô hình hình ảnh thế hệ mới của Google với độ phân giải 4K, 15 tỷ lệ khung hình (bao gồm 8:1 cực rộng), grounding bằng Google Search và tối đa 14 ảnh tham chiếu - trình tạo ảnh linh hoạt nhất trên Rivya.

Vì sao chọn

Độ phân giải tối đa 4K (có thể chọn 1K / 2K / 4K)

Phù hợp nhất cho
Concept hình ảnh khổ lớn và bố cục kiểu panorama
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 5 credit mỗi lần tạo
15 tỷ lệ khung hình, bao gồm 8:1 và 1:8 toàn cảnh cực rộngGrounding bằng Google Search cho bối cảnh đời thực

Google

Nano Banana Pro

Image

Mô hình ảnh cao cấp của Google với đầu ra 4K, 11 tỷ lệ khung hình và tối đa 8 ảnh tham chiếu. Được tối ưu cho hình ảnh thương hiệu và chiến dịch có độ trung thực cao, với chi tiết và độ chính xác màu tốt hơn.

Vì sao chọn

Độ phân giải tối đa 4K với độ trung thực được nâng cao

Phù hợp nhất cho
Visual thương hiệu cao cấp và hình ảnh marketing chất lượng cao hơn
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 8 credit mỗi lần tạo
11 tỷ lệ khung hình với tùy chọn tự động nhận diệnTối đa 8 ảnh tham chiếu để giữ tính nhất quán thương hiệu

Google

Nano Banana

Image

Mô hình ảnh linh hoạt của Google cho text-to-image và image-to-image với 11 tỷ lệ khung hình, tối đa 10 ảnh tham chiếu và đầu ra PNG/JPEG. Phù hợp tốt với chân dung, bố cục sản phẩm và visual landing page khổ rộng hơn.

Vì sao chọn

11 tỷ lệ khung hình, bao gồm 21:9 siêu rộng và chế độ auto

Phù hợp nhất cho
Bố cục sản phẩm với nhiều tham chiếu thị giác
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 3 credit mỗi lần tạo
Tối đa 10 ảnh tham chiếu để dẫn hướng sáng tạoTùy chọn định dạng đầu ra PNG và JPEG

OpenAI

GPT Image 2

Hình ảnh

Mô hình GPT Image mới hơn của OpenAI trên Rivya, với text-to-image, image-to-image, tối đa 16 hình ảnh tham chiếu và các tầng credit 1K / 2K / 4K rõ ràng.

Vì sao chọn

Text-to-image và image-to-image trong một trang mô hình Rivya

Phù hợp nhất cho
Hình ảnh sản phẩm và chiến dịch độ phân giải cao
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 3 credit mỗi lần tạo
Các tầng độ phân giải 1K, 2K và 4K để kiểm soát ngân sách rõ hơnTối đa 16 hình ảnh tham chiếu cho brief chỉnh sửa có cấu trúc

OpenAI

GPT Image 1.5

Hình ảnh

Mô hình hình ảnh của OpenAI với hai tầng chất lượng Trung bình/Cao và tối đa 16 hình ảnh tham chiếu. Mô hình nổi bật ở khả năng bám theo chỉ dẫn phức tạp và dựng cảnh mạch lạc với quan hệ không gian chính xác.

Vì sao chọn

Tối đa 16 hình ảnh tham chiếu — cao nhất trên Rivya

Phù hợp nhất cho
Hình ảnh sản phẩm và chiến dịch có nhiều chỉ dẫn
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 4 credit mỗi lần tạo
Hai tầng chất lượng Trung bình và Cao để kiểm soát chi phíHiểu prompt vượt trội nhờ mô hình ngôn ngữ của OpenAI

OpenAI

4o Image

Hình ảnh

Mô hình 4o Image của OpenAI hiện có trên Rivya như một đường dẫn text-to-image chuyên biệt. Thiết lập trang hiện được giữ chủ ý gọn: prompt cộng 3 tỷ lệ khung hình được hỗ trợ với mức cố định 3 credit cho mỗi ảnh.

Vì sao chọn

Lối vào OpenAI 4o Image riêng thay vì gộp vào mô hình khác

Phù hợp nhất cho
Hình ảnh concept nhanh từ một brief văn bản
Đầu vào
Văn bản
Đầu ra
Hình ảnh
Tín dụng
Từ 3 credit cho mỗi lần tạo
Luồng text-to-image với đường dẫn 3 credit cho mỗi ảnh như đã liệt kêBa lựa chọn tỷ lệ khung hình đã ghi rõ: 1:1, 3:2 và 2:3

ByteDance

Seedream 5.0 Lite

Hình ảnh

Mô hình hình ảnh Seedream nhẹ hơn của ByteDance với mức giá chung cho text-to-image và chỉnh sửa hình ảnh. Mô hình này hỗ trợ 8 tỷ lệ khung hình, tối đa 14 ảnh tham chiếu và hiện có giá 6 credit mỗi lượt chạy.

Vì sao chọn

Giá cố định 6 credit cho cả text-to-image và image-to-image

Phù hợp nhất cho
Mood board và hướng chiến dịch cần nhiều tham chiếu
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 6 credit mỗi lần tạo
Tối đa 14 ảnh tham chiếu cho dự án chỉnh sửa có dẫn hướng8 tỷ lệ khung hình, gồm cả siêu rộng 21:9

ByteDance

Seedream 4.5

Hình ảnh

Mô hình hình ảnh cao cấp của ByteDance với các tầng chất lượng 2K/4K, 8 tỷ lệ khung hình và tối đa 14 ảnh tham chiếu. Nổi bật nhờ color grading điện ảnh và chi tiết texture phong phú trong hình ảnh thời trang và lifestyle.

Vì sao chọn

Có thể chọn tầng chất lượng 2K (Basic) và 4K (High)

Phù hợp nhất cho
Hình ảnh chiến dịch thời trang và lifestyle
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 7 credit mỗi lần tạo
Tối đa 14 ảnh tham chiếu cho sáng tạo có dẫn hướng8 tỷ lệ khung hình, gồm cả siêu rộng 21:9

ByteDance

Seedream 4.0

Hình ảnh

Seedream 4.0 là mô hình hình ảnh ByteDance cân bằng trên Rivya cho tạo text-to-image, chỉnh sửa bằng ảnh tham chiếu và các điều khiển đầu ra rõ ràng.

Vì sao chọn

Một slot mô hình bao phủ cả text-to-image và chỉnh sửa hình ảnh

Phù hợp nhất cho
Hình ảnh lifestyle và bản nháp hình ảnh phong cách editorial
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Cố định 6 credit mỗi lần tạo
Giữ các điều khiển công khai `image_resolution` và `max_images` hiển thịHỗ trợ tối đa 10 ảnh tham chiếu cho đường dẫn chỉnh sửa

ByteDance

Seedream 3.0

Hình ảnh

Seedream 3.0 hiện trở lại trên Rivya như một mô hình hình ảnh dòng cũ độc lập. Mô hình này hiện chỉ giữ đường dẫn text-to-image công khai và có giá 5 credit mỗi lượt chạy.

Vì sao chọn

Giữ Seedream 3.0 như một mục text-to-image dòng cũ riêng

Phù hợp nhất cho
Các đội muốn giữ lại một hướng thị giác Seedream cũ hơn
Đầu vào
Văn bản
Đầu ra
Hình ảnh
Tín dụng
Cố định 5 credit mỗi lần tạo
Chỉ mở nhóm tham số mà tài liệu công khai thể hiện rõBề mặt tham số nhẹ hơn các tùy chọn Seedream mới hơn

xAI

Grok Imagine

Hình ảnh

Mô hình hình ảnh của xAI với khả năng diễn giải sáng tạo mạnh và 5 tỷ lệ khung hình. Tạo một hình ảnh, tập trung vào biểu đạt nghệ thuật và phong cách thị giác phi quy ước.

Vì sao chọn

Diễn giải sáng tạo và nghệ thuật mạnh

Phù hợp nhất cho
Hình ảnh concept táo bạo và hướng nghệ thuật thử nghiệm
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 4 credit mỗi lần tạo
Phong cách hình ảnh độc đáo, khác biệt với các mô hình khácHỗ trợ text-to-image và image-to-image

Black Forest Labs

Flux 2 Pro

Hình ảnh

Mô hình chủ lực 32B tham số của Black Forest Labs. Hỗ trợ tạo ảnh từ văn bản và tạo ảnh từ ảnh với tối đa 8 ảnh tham chiếu, độ phân giải 2K và khả năng render chữ chính xác — được xây dựng cho ảnh sản phẩm và hình ảnh thương hiệu.

Vì sao chọn

Độ phân giải tối đa 2K với chất liệu ảnh chân thực

Phù hợp nhất cho
Ảnh tĩnh sản phẩm và ảnh hero cho ecommerce
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 5 credit cho mỗi lần tạo
Render chữ và logo chính xác trong ảnhTối đa 8 ảnh tham chiếu để giữ nhất quán phong cách/nhân vật

Black Forest Labs

Flux 2 Flex

Hình ảnh

Biến thể tập trung vào chỉnh sửa của dòng Flux 2. Mô hình chuyên xử lý điều chỉnh cấu trúc và chuyển phong cách với tối đa 8 ảnh tham chiếu cùng độ phân giải 2K — lý tưởng để lặp lại và tinh chỉnh hình ảnh sẵn có.

Vì sao chọn

Tối ưu cho chỉnh sửa ảnh và chuyển phong cách

Phù hợp nhất cho
Chỉnh sửa một hình ảnh chiến dịch hoặc sản phẩm đã có
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 14 credit cho mỗi lần tạo
Tối đa 8 ảnh tham chiếu để dẫn hướng chỉnh sửaXuất ảnh độ phân giải 2K với chất lượng Flux 2

Black Forest Labs

Flux Kontext Max

Hình ảnh

Mô hình Flux Kontext nâng cao của Black Forest Labs cho các tác vụ tạo ảnh và chỉnh sửa ảnh theo prompt đòi hỏi cao hơn. Rivya hiện giữ cả tạo ảnh từ văn bản và tạo ảnh từ ảnh trong cùng dự án async, đồng thời định giá cố định 8 credit cho mỗi lượt chạy theo chính sách hiện tại của nền tảng.

Vì sao chọn

Định giá cố định 8 credit cho cả tạo mới và chỉnh sửa trên Rivya

Phù hợp nhất cho
Tinh chỉnh key visual cho một campaign still quan trọng
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 8 credit cho mỗi lần tạo
Tầng Kontext cao hơn cho prompt hoặc tác vụ chỉnh sửa khó hơnMột dự án một mô hình cho tạo ảnh từ văn bản và chỉnh sửa một ảnh

Black Forest Labs

Flux Kontext Pro

Hình ảnh

Dự án Flux Kontext chi phí thấp hơn của Black Forest Labs cho tạo ảnh từ văn bản và chỉnh sửa một ảnh. Rivya hiện mở cả tạo ảnh từ văn bản và tạo ảnh từ ảnh trên cùng dự án ảnh async, với định giá cố định 4 credit cho cả hai chế độ theo chính sách giá hiện tại của nền tảng.

Vì sao chọn

Định giá cố định 4 credit cho cả tạo mới và chỉnh sửa trên Rivya

Phù hợp nhất cho
Biến thể quảng cáo và mạng xã hội từ một ảnh nguồn đã duyệt
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 4 credit cho mỗi lần tạo
Một dự án một mô hình cho tạo ảnh từ văn bản và chỉnh sửa một ảnhCông tắc dịch tích hợp để đáp ứng yêu cầu prompt chỉ bằng tiếng Anh

Alibaba

Qwen2 Image

Image

Mô hình hình ảnh Qwen2 của Alibaba hiện được tích hợp trên Rivya như một dự án ảnh giá cố định. Nó bao phủ an toàn text-to-image và image-to-image với tập con tỷ lệ khung hình chung mà cả hai tài liệu công khai đều nêu, cùng đầu ra PNG/JPEG, tái sử dụng seed và một công tắc NSFW đơn giản.

Vì sao chọn

Giá cố định 6 credit cho cả text-to-image và image-to-image

Phù hợp nhất cho
Poster và visual chiến dịch bằng tiếng Trung
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 6 credit mỗi lần tạo
Dùng `qwen2/text-to-image` cho lượt chạy text và `qwen2/image-edit` cho lượt chạy có ảnh tham chiếuTập con tỷ lệ khung hình an toàn dùng chung trên cả hai tài liệu Qwen2 công khai

Alibaba

Qwen Image

Image

Mô hình hình ảnh thuộc gia đình Alibaba Qwen với preset HD (Square, Portrait, Landscape) và đầu ra PNG/JPEG. Mạnh với prompt tiếng Trung và tạo hình ảnh có sắc thái văn hóa.

Vì sao chọn

Kích thước preset HD: Square, Portrait 4:3/16:9, Landscape 4:3/16:9

Phù hợp nhất cho
Visual marketing bằng tiếng Trung
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 4 credit mỗi lần tạo
Hiểu prompt tiếng Trung rất tốtTùy chọn định dạng đầu ra PNG và JPEG

Midjourney

Midjourney

Image

Mô hình ảnh V7 của Midjourney cho text-to-image và image-to-image, với các chế độ anime Niji, 3 bậc tốc độ (Relaxed/Fast/Turbo), tham chiếu phong cách và tính nhất quán do Omni Reference dẫn dắt. Vẫn là chuẩn mực cho art điện ảnh, minh họa và moodboard.

Vì sao chọn

Chất lượng thẩm mỹ vượt trội - chuẩn mực của ngành

Phù hợp nhất cho
Concept art điện ảnh và moodboard
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 3 credit mỗi lần tạo
V7 + V6.1 + V6 + các chế độ anime Niji 7/63 bậc tốc độ: Relaxed, Fast, Turbo

Recraft

Recraft Remove Background

Image

Mô hình xóa nền của Recraft trên Rivya để tách chủ thể khỏi một ảnh hiện có. Dùng khi bước tiếp theo cần asset trong suốt, cutout sạch hoặc ảnh nguồn không còn nền gốc.

Vì sao chọn

Công cụ cutout một mục đích với giá cố định 1 credit

Phù hợp nhất cho
Xóa nền khỏi một ảnh sản phẩm, chân dung hoặc catalog trước công việc thiết kế
Đầu vào
Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 1 credit mỗi lần tạo
Được xây cho một ảnh đã upload và thường không cần promptPhù hợp tốt với ảnh sản phẩm, chân dung và asset khác có viền chủ thể dễ đọc

Recraft

Recraft Crisp Upscale

Image

Mô hình upscale ảnh nhẹ của Recraft trên Rivya để tăng độ sắc nét và độ rõ với chi phí thấp cho một ảnh tĩnh đã duyệt. Dùng khi ảnh đã chọn chỉ cần một bước polish rẻ trước khi xuất, không phải một lượt upscale nặng cấp giao hàng.

Vì sao chọn

Một bước cleanup cố định 1 credit cho một ảnh đã upload

Phù hợp nhất cho
Tăng nhanh độ rõ cho một thumbnail, social graphic hoặc ảnh sản phẩm nhỏ
Đầu vào
Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 1 credit mỗi lần tạo
Phù hợp để tăng độ sắc nét nhanh và phóng nhẹ trước khi xuất bản hoặc bàn giaoKhông yêu cầu prompt và không có thang kích thước phải quản lý, nên hữu ích như một bước precheck ít ma sát

Alibaba

Wan 2.7 Image Pro

Hình ảnh

Mô hình hình ảnh Wan 2.7 cao cấp hơn của Alibaba, hiện được Rivya đưa vào như một vị trí hình ảnh riêng cho text-to-image và chỉnh sửa hình ảnh. Chi phí được giữ cố định ở 12 credit mỗi lượt chạy bằng cách giới hạn rõ ràng mỗi lần tạo chỉ có một ảnh đầu ra.

Vì sao chọn

Giá cố định 12 credit cho cả text-to-image và image-to-image

Phù hợp nhất cho
Key visual thương hiệu và ảnh tĩnh cho chiến dịch ra mắt
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 12 credit cho mỗi lần tạo
Tối đa 9 ảnh tham chiếu cho các dự án chỉnh sửa có định hướngCùng thuộc họ hình ảnh Wan 2.7, với một tầng cao cấp rõ ràng hơn

Alibaba

Wan 2.7 Image

Hình ảnh

Mô hình hình ảnh Wan 2.7 tiêu chuẩn của Alibaba được Rivya đưa vào như một vị trí hình ảnh riêng cho text-to-image và chỉnh sửa hình ảnh, hiện có chi phí 5 credit mỗi lượt chạy.

Vì sao chọn

Hiện có chi phí 5 credit mỗi lượt chạy

Phù hợp nhất cho
Bảng nháp mạng xã hội và chiến dịch dùng nhiều ảnh tham chiếu
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 5 credit cho mỗi lần tạo
Hỗ trợ cả text-to-image và image-to-imageTối đa 9 ảnh tham chiếu cho các lượt chỉnh sửa có định hướng

Google

Google Imagen4 Ultra

Hình ảnh

Google Imagen4 Ultra là tầng tạo ảnh từ văn bản Imagen cao cấp của Rivya. Hiện mô hình được tích hợp như dự án một ảnh, cố định 12 credit, với các điều khiển công khai gồm prompt, prompt loại trừ, tỷ lệ khung hình và seed.

Vì sao chọn

Định giá cố định 12 credit trên Rivya

Phù hợp nhất cho
Hero art trang chủ và hình ảnh campaign cao cấp
Đầu vào
Văn bản
Đầu ra
Hình ảnh
Tín dụng
Từ 12 credit cho mỗi lần tạo
Tầng Google Imagen tạo ảnh từ văn bản cao cấpĐiều khiển prompt loại trừ, tỷ lệ khung hình và seed

Google

Google Imagen4

Hình ảnh

Google Imagen4 là tầng tạo ảnh từ văn bản Imagen tiêu chuẩn của Rivya. Hiện mô hình được tích hợp như dự án một ảnh, cố định 8 credit, với các điều khiển công khai gồm prompt, prompt loại trừ, tỷ lệ khung hình và seed.

Vì sao chọn

Định giá cố định 8 credit trên Rivya

Phù hợp nhất cho
Đồ họa hero cho website và minh họa editorial
Đầu vào
Văn bản
Đầu ra
Hình ảnh
Tín dụng
Từ 8 credit cho mỗi lần tạo
Tầng Google Imagen tạo ảnh từ văn bản tiêu chuẩnĐiều khiển prompt loại trừ, tỷ lệ khung hình và seed

Google

Google Imagen4 Fast

Hình ảnh

Google Imagen4 Fast là tầng tạo ảnh từ văn bản Imagen nhẹ của Rivya. Hiện mô hình giữ dự án một ảnh, dùng định giá cố định 4 credit và mở các điều khiển công khai gồm prompt, prompt loại trừ, tỷ lệ khung hình và seed mà không mở đầu ra nhiều ảnh.

Vì sao chọn

Định giá cố định 4 credit trên Rivya

Phù hợp nhất cho
Hướng hình ảnh nhanh cho landing page hoặc blog
Đầu vào
Văn bản
Đầu ra
Hình ảnh
Tín dụng
Từ 4 credit cho mỗi lần tạo
Lối vào Google Imagen tạo ảnh từ văn bản nhẹĐiều khiển prompt loại trừ, tỷ lệ khung hình và seed

Topaz

Topaz Image Upscaler

Hình ảnh

Trình upscale hình ảnh cấp giao hàng của Topaz trên Rivya dành cho các ảnh tĩnh đã được duyệt và cần tăng kích thước thật sự. Dùng khi bố cục đã là bản cuối và vấn đề còn lại là độ phân giải xuất file, kích thước duyệt hoặc sẵn sàng in.

Vì sao chọn

Dành cho ảnh tĩnh đã được duyệt cần tăng kích thước giao hàng thật sự, không phải tạo lại bố cục

Phù hợp nhất cho
Upscale ảnh ecommerce, sản phẩm hoặc chiến dịch đã được duyệt cho định dạng giao hàng lớn hơn
Đầu vào
Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 5 credit mỗi lượt chạy
Thang UI rõ ràng dựa trên hệ số 1, 2, 4 và 8 giúp dễ chọn đánh đổi giữa kích thước và chi phíPhù hợp hơn Recraft Crisp Upscale khi ảnh tĩnh đã chọn là bản cuối và kích thước đầu ra thật sự quan trọng

Ideogram

Ideogram V3

Hình ảnh

Ideogram V3 là mô hình chuyển văn bản thành hình ảnh trên Rivya cho dựng chữ, bố cục poster và prompt hình ảnh ưu tiên thiết kế. Giá hiện tại là 4 credit cho TURBO, 7 cho BALANCED và 10 cho QUALITY.

Vì sao chọn

Các mức tốc độ render: TURBO, BALANCED, QUALITY

Phù hợp nhất cho
Ý tưởng poster và đồ họa quảng cáo dẫn dắt bằng tiêu đề
Đầu vào
Văn bản
Đầu ra
Hình ảnh
Tín dụng
Từ 4 credit cho mỗi lần tạo
Tạo hình ảnh Ideogram V3 định hướng thiết kếCông tắc mở rộng MagicPrompt

Ideogram

Ideogram V3 Reframe

Hình ảnh

Ideogram V3 Reframe hiện được tích hợp trên Rivya như một dự án chỉnh khung một ảnh với giá theo tốc độ render. Giá hiện tại là 4 credit cho TURBO, 7 cho BALANCED và 10 cho QUALITY.

Vì sao chọn

Các mức tốc độ render: TURBO, BALANCED, QUALITY

Phù hợp nhất cho
Điều chỉnh một hình ảnh đã duyệt sang tỷ lệ khung hình mới
Đầu vào
Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 4 credit cho mỗi lần tạo
Dự án chỉnh khung một ảnhPrompt là tùy chọn với mô hình này

Ideogram

Ideogram V3 Remix

Hình ảnh

Ideogram V3 Remix hiện được tích hợp trên Rivya như một dự án remix một ảnh với giá theo tốc độ render. Giá hiện tại là 4 credit cho TURBO, 7 cho BALANCED và 10 cho QUALITY.

Vì sao chọn

Các mức tốc độ render: TURBO, BALANCED, QUALITY

Phù hợp nhất cho
Hướng nghệ thuật thay thế từ một ảnh nguồn
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 4 credit cho mỗi lần tạo
Dự án remix một ảnhĐiều khiển MagicPrompt, strength và prompt phủ định

Ideogram

Ideogram Character

Hình ảnh

Tùy chọn giữ nhất quán nhân vật để biến một ảnh nhân vật đã duyệt thành cảnh, trang phục và định dạng mới. Dùng khi việc giữ nhận diện quan trọng hơn chỉnh sửa ảnh rộng, và bạn chỉ cần một ảnh đầu ra mỗi lần.

Vì sao chọn

Dự án một tham chiếu được tinh chỉnh để giữ một nhân vật dễ nhận ra qua các cảnh mới

Phù hợp nhất cho
Giữ một linh vật, avatar hoặc nhân vật minh họa dễ nhận ra qua nhiều cảnh mới
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Hình ảnh
Tín dụng
Từ 12 credit cho mỗi lần tạo
Tách riêng khỏi Ideogram V3, Reframe và Remix để người dùng chọn tính nhất quán thay vì tự do chỉnh sửa rộng hơnĐầu ra một ảnh dễ dự đoán với các mức credit TURBO, BALANCED và QUALITY

ByteDance

Seedance 2.0

Video

Mô hình video Seedance 2.0 đầy đủ của ByteDance với hỗ trợ rõ ràng cho tạo prompt-only, animation dẫn dắt bằng khung hình và tạo video tham chiếu đa phương thức. Rivya giữ rõ phần tách vai trò theo tài liệu để đầu vào khung hình và tham chiếu đa phương thức tách biệt nhau, thay vì gom vào một nhóm upload mơ hồ.

Vì sao chọn

Tách cảnh Seedance 2.0 đầy đủ: text, khung hình và tham chiếu đa phương thức

Phù hợp nhất cho
Video ngắn chất lượng cao hơn từ prompt, khung hình hoặc gói tham chiếu
Đầu vào
Văn bản
Đầu ra
Video
Tín dụng
Từ 64 credit mỗi lượt chạy
Dự án theo prompt, theo khung hình và tham chiếu đa phương thức trong một mô hìnhĐầu ra 480p và 720p với hỗ trợ tỷ lệ khung hình adaptive

ByteDance

Seedance 2.0 Fast

Video

Mô hình video Seedance 2.0 nhanh hơn của ByteDance với định tuyến cảnh đầy đủ cho tạo prompt-only, animation dẫn dắt bằng khung hình và tạo video tham chiếu đa phương thức. Rivya giữ rõ phần tách cảnh theo tài liệu để đầu vào khung đầu/cuối không lẫn với vai trò ảnh, video và âm thanh tham chiếu.

Vì sao chọn

Tách cảnh Seedance 2.0 Fast đầy đủ: text, khung hình và tham chiếu đa phương thức

Phù hợp nhất cho
Previs quảng cáo nhanh từ prompt hoặc khung storyboard
Đầu vào
Văn bản
Đầu ra
Video
Tín dụng
Từ 52 credit mỗi lượt chạy
Đầu ra 480p và 720p với hỗ trợ tỷ lệ khung hình adaptiveTạo âm thanh đồng bộ và trả về khung cuối tùy chọn

ByteDance

Seedance 1.5 Pro

Video

Mô hình video flagship của ByteDance cho text-to-video và image-to-video với đồng bộ âm thanh-hình ảnh native. Hỗ trợ 480p-1080p, clip 4-12s, 6 tỷ lệ khung hình, điều khiển ống kính động/cố định, tạo âm thanh tùy chọn và lip-sync.

Vì sao chọn

Đồng bộ âm thanh-hình ảnh native với lip-sync chính xác

Phù hợp nhất cho
Clip ngắn có lời thoại và chuyển động đồng bộ
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
Từ 28 credit mỗi lần tạo
Tùy chọn độ phân giải 480p / 720p / 1080pThời lượng clip có thể cấu hình 4s, 8s hoặc 12s

ByteDance

Seedance 1.0 Pro

Video

Mô hình Seedance 1.0 Pro của ByteDance, được mở trên Rivya như tùy chọn 1.0 Pro tiêu chuẩn cho cả text-to-video và image-to-video. Thiết lập trang hiện được giữ căn chỉnh với tài liệu V1 Pro công khai, gồm điều khiển độ phân giải, thời lượng, khóa camera, seed và kiểm tra an toàn.

Vì sao chọn

Hỗ trợ cả text-to-video và image-to-video

Phù hợp nhất cho
Clip ngắn có cảm giác điện ảnh
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
Từ 25 credit mỗi lần tạo
Các bậc đầu ra 480p, 720p và 1080pĐiều khiển thời lượng 5s và 10s

ByteDance

Seedance 1.0 Pro Fast

Video

Mô hình image-to-video nhanh của ByteDance. Biến một ảnh tham chiếu thành clip 5s hoặc 10s ở 720p/1080p - tối ưu cho tốc độ khi bạn cần video nhanh từ một ảnh tĩnh.

Vì sao chọn

Chuyên image-to-video - thời gian trả kết quả nhanh

Phù hợp nhất cho
Animation nhanh từ ảnh tĩnh sang video
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
16-72 credit mỗi lần tạo
Tùy chọn độ phân giải 720p và 1080pThời lượng clip 5s hoặc 10s

ByteDance

Seedance 1.0 Lite

Video

Mô hình Seedance 1.0 Lite của ByteDance được mở trên Rivya như tùy chọn 1.0 nhẹ hơn cho cả text-to-video và image-to-video. Nó theo bộ tham số V1 Lite công khai và hiện dùng thang giá thấp hơn Seedance 1.0 Pro.

Vì sao chọn

Hỗ trợ cả text-to-video và image-to-video

Phù hợp nhất cho
Thử storyboard chi phí thấp hơn
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
Từ 16 credit mỗi lần tạo
Giá thấp hơn Seedance 1.0 ProẢnh thứ hai tùy chọn làm khung cuối trong chế độ image-to-video

HappyHorse

HappyHorse 1.0

Video

Một mô hình video AI linh hoạt trên Rivya cho chuyển văn bản thành video, chuyển động từ một ảnh, video tham chiếu từ nhiều ảnh và chỉnh sửa video, tất cả từ một trang mô hình công khai.

Vì sao chọn

Một trang mô hình bao phủ quy trình văn bản, ảnh, tham chiếu và chỉnh sửa video

Phù hợp nhất cho
Bản nháp chuyển động quảng cáo hoặc sản phẩm ngắn từ brief viết sẵn
Đầu vào
Văn bản / Tham chiếu / Hình ảnh / Video
Đầu ra
Video
Tín dụng
Từ 28 credit cho mỗi lần tạo
Hỗ trợ các mức đầu ra giá cố định 720p và 1080pChấp nhận tối đa 9 ảnh tham chiếu khi không đính kèm video

Alibaba

Wan 2.7 Video

Video

Dòng video Wan mới hơn của Alibaba, tính giá theo độ phân giải và thời lượng. Rivya hiện đưa text-to-video, image-to-video và chỉnh sửa video vào cùng một vị trí mô hình, bắt đầu từ 80 credit cho mỗi lần tạo.

Vì sao chọn

Tính giá theo độ phân giải và thời lượng: 720p = 16 credit/giây, 1080p = 24 credit/giây

Phù hợp nhất cho
Video quảng bá sản phẩm ngắn và bản cắt mạng xã hội
Đầu vào
Văn bản / Tham chiếu / Hình ảnh / Video
Đầu ra
Video
Tín dụng
Từ 80 credit cho mỗi lần tạo
Hỗ trợ text-to-video, image-to-video và chỉnh sửa video trong một vị trí mô hìnhImage-to-video có thể dùng một ảnh hoặc một cặp khung đầu và khung cuối

Alibaba

Wan 2.6

Video

Tùy chọn Wan ba chế độ của Alibaba trên Rivya: text-to-video, image-to-video và chỉnh sửa video nguồn trong một dự án. Nó hỗ trợ 720p/1080p, clip 5-15 giây và mỗi lần nhận một ảnh hoặc một video nguồn.

Vì sao chọn

Ba chế độ: text-to-video + image-to-video + video-to-video

Phù hợp nhất cho
Chỉnh sửa video-to-video từ một clip nguồn có sẵn
Đầu vào
Văn bản / Tham chiếu / Hình ảnh / Video
Đầu ra
Video
Tín dụng
Từ 70 credit mỗi lần tạo
Một tùy chọn Wan nặng có thể bắt đầu từ video nguồn thay vì chỉ từ văn bản hoặc ảnh tĩnhMột ảnh hoặc một video nguồn giúp đường dẫn chỉnh sửa rõ ràng

Alibaba

Wan 2.5 Video

Video

Wan 2.5 hiện được mở trên Rivya như một lối vào chung cho text-to-video và image-to-video. Giá hiện tại là `720p_5 = 60`, `720p_10 = 120`, `1080p_5 = 100` và `1080p_10 = 200` credit.

Vì sao chọn

Một slot mô hình cho cả text-to-video và image-to-video

Phù hợp nhất cho
Clip quảng bá Wan 5 hoặc 10 giây từ văn bản hoặc một ảnh hero
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
Từ 60 credit mỗi lần tạo
Giá đi theo bốn tầng độ phân giải và thời lượng hiển thị rõGiữ chuỗi kết quả video async hiện có mà không thêm loại kết quả mới

Alibaba

Wan 2.2 A14B Turbo

Video

Wan 2.2 A14B Turbo hiện bao phủ text-to-video, image-to-video và đường dẫn video dẫn dắt bằng hình ảnh kèm âm thanh trên Rivya. Giá hiện tại là `480p = 8` và `720p = 12` cho lượt chạy từ văn bản hoặc hình ảnh, cộng thêm `480p = 16`, `580p = 20` và `720p = 24` khi một ảnh và một clip âm thanh dẫn dắt kết quả.

Vì sao chọn

Một slot mô hình hiện bao phủ tạo video từ văn bản, hình ảnh và hình ảnh cộng âm thanh

Phù hợp nhất cho
Thử nghiệm text-to-video Wan nhẹ hơn
Đầu vào
Văn bản / Tham chiếu / Hình ảnh / Âm thanh
Đầu ra
Video
Tín dụng
Từ 8 credit mỗi lần tạo
Giá business giữ phân tầng giữa lượt chạy văn bản-hình ảnh nhẹ hơn và lượt chạy hình ảnh cộng âm thanh nặng hơnĐường dẫn hình ảnh cộng âm thanh giữ nhóm tham số nâng cao riêng thay vì gom mọi thứ về mặc định

Alibaba

Wan Animate Replace

Video

Mô hình video thay thế nhân vật của Wan trên Rivya để đổi chủ thể xuất hiện trong một clip có sẵn. Dùng một URL video nguồn công khai, một URL ảnh thay thế công khai và một tầng độ phân giải khi chuyển động đã đúng nhưng chủ thể nhìn thấy cần thay đổi.

Vì sao chọn

Giữ hình dạng công khai `video_url + image_url + resolution` thay vì tạo một dự án nặng về prompt

Phù hợp nhất cho
Thay thế chủ thể hoặc nhân vật trên màn hình trong khi giữ chuyển động của clip nguồn
Đầu vào
Video
Đầu ra
Video
Tín dụng
Từ 12 credit mỗi lần tạo
Phù hợp nhất với hoán đổi chủ thể hoặc nhân vật khi chuyển động gốc nên được giữ nguyênHoạt động tốt khi cả hai asset đã nằm trên lưu trữ công khai và upstream có thể fetch

MiniMax

Hailuo 2.3

Video

Mô hình chuyển ảnh thành video của MiniMax với các mức chất lượng Standard/Pro, độ phân giải 768P/1080P và clip 6 giây hoặc 10 giây. Nổi bật ở chuyển động mượt hơn và các đoạn chuyển tiếp tự nhiên từ ảnh tĩnh.

Vì sao chọn

Các mức chất lượng Standard và Pro

Phù hợp nhất cho
Tạo chuyển động từ ảnh tĩnh chân dung hoặc thời trang
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
Từ 25 credit cho mỗi lần tạo
Tùy chọn độ phân giải 768P và 1080PThời lượng clip có thể cấu hình 6 giây hoặc 10 giây

MiniMax

Hailuo Pro

Video

Mô hình video Hailuo Pro đời cũ của MiniMax được kết nối tại đây như một mô hình cố định ở mức Pro cho cả chuyển văn bản thành video và chuyển ảnh thành video. Chế độ ảnh chấp nhận 1 hoặc 2 ảnh tham chiếu, trong đó ảnh thứ hai được dùng làm khung hình cuối, và mỗi lượt chạy hiện tốn 57 credit.

Vì sao chọn

Một mô hình cho cả chuyển văn bản thành video và chuyển ảnh thành video

Phù hợp nhất cho
Bản nháp chuyển động chất lượng cao hơn từ một hình ảnh chủ đạo
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
57 credit cho mỗi lần tạo
Chế độ ảnh hỗ trợ khung hình đầu hoặc cặp khung hình đầu-cuốiĐược kết nối ở mức Pro cố định đã được xác nhận công khai

MiniMax

Hailuo Standard

Video

Mô hình video Hailuo Standard đời cũ của MiniMax, được hợp nhất tại đây thành một mô hình cho cả chuyển văn bản thành video và chuyển ảnh thành video. Chế độ ảnh chấp nhận 1 hoặc 2 ảnh tham chiếu, trong đó ảnh thứ hai được dùng làm khung hình cuối, và các mức giá công khai hiện đã xác minh nằm trong khoảng 12 đến 50 credit.

Vì sao chọn

Một mô hình cho cả chuyển văn bản thành video và chuyển ảnh thành video

Phù hợp nhất cho
Biến một ảnh hero tĩnh thành teaser chuyển động ngắn
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
12-50 credit cho mỗi lần tạo
Chế độ ảnh hỗ trợ khung hình đầu hoặc cặp khung hình đầu-cuốiCác mức tạo từ ảnh 512P và 768P

Kuaishou

Kling 3.0

Video

Mô hình video cao cấp của Kuaishou cho chuyển văn bản thành video và chuyển ảnh thành video, với các mức Standard (720P) / Pro (1080P), cấu trúc một cảnh hoặc nhiều cảnh, thời lượng 3-15 giây, tạo âm thanh tùy chọn và tối đa 2 ảnh tham chiếu.

Vì sao chọn

Các mức chất lượng Standard (720P) và Pro (1080P)

Phù hợp nhất cho
Previs quảng cáo kiểu storyboard với kế hoạch cảnh rõ ràng
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
Từ 42 credit cho mỗi lần tạo
Chế độ tạo một cảnh hoặc nhiều cảnhThời lượng clip linh hoạt 3-15 giây

Kuaishou

Kling 3.0 motion-control

Video

Tùy chọn Kling motion-control mới hơn để điều khiển một chủ thể từ một ảnh tham chiếu cộng một video chuyển động, với lựa chọn nguồn nền rõ ràng. Dùng khi bạn muốn chuyển động cộng khả năng kiểm soát mạnh hơn về việc cảnh nên đến từ video hay ảnh.

Vì sao chọn

Dự án đúng 1 ảnh + 1 video chuyển động giữ rõ vai trò nhận diện và chuyển động

Phù hợp nhất cho
Lượt chuyển động cần chọn nền đến từ video chuyển động hay ảnh tham chiếu
Đầu vào
Văn bản / Tham chiếu / Hình ảnh / Video
Đầu ra
Video
Tín dụng
Từ 20 credit cho mỗi lần tạo
Thêm `background_source` bên trên hướng nhân vật, là nâng cấp chính so với Kling 2.6 motion-controlGiá cố định Standard (720P) và Pro (1080P) ở mức 20 / 27 credit

Kuaishou

Kling 2.6

Video

Mô hình video của Kuaishou với tạo âm thanh tùy chọn, clip 5 giây/10 giây và 3 tỷ lệ khung hình. Mạnh về chuyển động con người và hoạt ảnh nhân vật giàu biểu cảm với vật lý tự nhiên.

Vì sao chọn

Tạo âm thanh tùy chọn cùng video

Phù hợp nhất cho
Diễn xuất nhân vật và chuyển động biểu cảm
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
Từ 55 credit cho mỗi lần tạo
Thời lượng clip 5 giây hoặc 10 giây3 tỷ lệ khung hình: 1:1, 16:9, 9:16

Kuaishou

Kling 2.6 motion-control

Video

Dự án chuyển động chuyên dụng để điều khiển một chủ thể từ một ảnh tham chiếu cộng một video chuyển động. Dùng khi bạn muốn một lượt Kling motion-control rẻ hơn và có thể không cần các điều khiển cảnh bổ sung trong Kling 3.0 motion-control.

Vì sao chọn

Dự án đúng 1 ảnh + 1 video chuyển động, nên rõ phần nào điều khiển nhận diện và phần nào điều khiển chuyển động

Phù hợp nhất cho
Điều khiển một nhân vật từ ảnh tĩnh cộng một clip tham chiếu chuyển động riêng
Đầu vào
Văn bản / Tham chiếu / Hình ảnh / Video
Đầu ra
Video
Tín dụng
Từ 16 credit cho mỗi lần tạo
Điểm vào rẻ hơn Kling 3.0 motion-control ở mức 16 / 22 creditPrompt tùy chọn để clip chuyển động tải lên vẫn giữ vai trò chính

Kuaishou

Kling V2.5 Turbo Pro

Video

Mô hình video Kling V2.5 Turbo Pro của Kuaishou, hiện hỗ trợ cả text-to-video và image-to-video. Bằng chứng giá công khai bao phủ rõ cả hai bậc text và image ở 5 giây và 10 giây, nên Rivya ánh xạ trực tiếp thành 42 / 84 credit.

Vì sao chọn

Bằng chứng giá công khai rõ ràng cho cả bậc text và image

Phù hợp nhất cho
Previs quảng cáo ngắn từ text hoặc từ khung đầu/cuối
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
42-84 credit mỗi lần tạo
Tạo từ text và image dùng chung một mục mô hình đã căn chỉnhChế độ image hỗ trợ một khung đầu kèm một khung cuối tùy chọn

Kuaishou

Kling V2.1 Master

Video

Mô hình video Kling V2.1 Master đời cũ của Kuaishou hiện hỗ trợ cả chuyển văn bản thành video và chuyển ảnh thành video trên Rivya. Giá hiện tại là 160 credit cho 5 giây và 320 credit cho 10 giây.

Vì sao chọn

Các mức giá cố định cho 5 giây và 10 giây

Phù hợp nhất cho
So sánh Kling Master legacy với các mức mới hơn
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
160-320 credit cho mỗi lần tạo
Tạo từ văn bản và ảnh hiện dùng chung một mục mô hình đã căn chỉnhChế độ văn bản giữ `aspect_ratio`, còn chế độ ảnh chỉ dùng các trường có chứng cứ từ tài liệu

Kuaishou

Kling V2.1 Pro

Video

Mô hình chuyển ảnh thành video Kling V2.1 Pro đời cũ của Kuaishou hỗ trợ một khung đầu cộng một ảnh khung cuối tùy chọn. Giá hiện tại là 50 credit cho 5 giây và 100 credit cho 10 giây.

Vì sao chọn

Chỉ chuyển ảnh thành video, với dự án hẹp hơn

Phù hợp nhất cho
Thử nghiệm cảnh trước-sau hoặc khung bắt đầu-kết thúc
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
50-100 credit cho mỗi lần tạo
Hỗ trợ khung đầu và khung cuối tùy chọnCác mức giá cố định cho 5 giây và 10 giây

Kuaishou

Kling V2.1 Standard

Video

Mô hình chuyển ảnh thành video Kling V2.1 Standard đời cũ của Kuaishou. Giá hiện tại là 25 credit cho 5 giây và 50 credit cho 10 giây.

Vì sao chọn

Chỉ chuyển ảnh thành video

Phù hợp nhất cho
Tạo chuyển động nhanh từ một ảnh tĩnh sản phẩm
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
25-50 credit cho mỗi lần tạo
Các mức giá cố định cho 5 giây và 10 giâyHỗ trợ `negative_prompt` và `cfg_scale`

Kuaishou

Kling AI Avatar Pro

Video

Mô hình avatar nói chuyện Kling AI Avatar Pro chất lượng cao hơn của Kuaishou, dùng một ảnh chân dung cộng một clip âm thanh để tạo video avatar khớp môi. Rivya hiện định giá cố định 16 credit cho mỗi lần tạo.

Vì sao chọn

Dự án avatar nói chuyện chất lượng cao cố định với chân dung cộng âm thanh

Phù hợp nhất cho
Video avatar nói chuyện chất lượng cao hơn
Đầu vào
Văn bản / Tham chiếu / Hình ảnh / Âm thanh
Đầu ra
Video
Tín dụng
16 credit cho mỗi lần tạo
Giá cố định 16 credit trên RivyaPhù hợp hơn cho đầu ra khớp môi ưu tiên chất lượng

Kuaishou

Kling AI Avatar Standard

Video

Mô hình avatar nói chuyện Kling AI Avatar Standard của Kuaishou, dùng một ảnh chân dung cộng một clip âm thanh để tạo video avatar khớp môi. Rivya hiện định giá cố định 8 credit cho mỗi lần tạo.

Vì sao chọn

Dự án avatar nói chuyện cố định với chân dung cộng âm thanh

Phù hợp nhất cho
Video avatar nói chuyện
Đầu vào
Văn bản / Tham chiếu / Hình ảnh / Âm thanh
Đầu ra
Video
Tín dụng
8 credit cho mỗi lần tạo
Giá cố định 8 credit trên RivyaĐường khớp môi đơn giản

MeiGen-AI

Infinitalk

Video

Infinitalk là mô hình video nói chuyện dùng chân dung cộng âm thanh. Giá hiện tại được tính theo độ phân giải và thời lượng âm thanh: 480p = 3 credit mỗi giây và 720p = 12 credit mỗi giây.

Vì sao chọn

Dự án video nói chuyện cố định với chân dung cộng âm thanh

Phù hợp nhất cho
Video avatar nói chuyện
Đầu vào
Văn bản / Tham chiếu / Hình ảnh / Âm thanh
Đầu ra
Video
Tín dụng
3 hoặc 12 credit mỗi giây
Credit đi theo độ phân giải và thời lượng âm thanh đã xác minhHỗ trợ các mức đầu ra 480p và 720p

Runway

Runway

Video

Runway là mô hình video độc lập hỗ trợ cả text-to-video và image-to-video. Bằng chứng giá công khai hiện chỉ xác nhận 6 bậc tạo, nên Rivya giữ nó trong tập đã kiểm chứng: `720p_5 = 12`, `720p_10 = 30`, và `1080p_5 = 30`.

Vì sao chọn

Bằng chứng giá công khai rõ ràng cho cả bậc text và image

Phù hợp nhất cho
Teaser ra mắt 5 giây và quảng cáo social
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
12-30 credit mỗi lần tạo
Tạo từ text và image dùng chung một mục mô hình đã căn chỉnhChế độ text giữ `aspectRatio`, còn chế độ image theo tỷ lệ ảnh nguồn

Runway

Runway Aleph

Video

Dự án biến đổi source-video để chỉnh một clip hiện có thành kết quả thị giác mới. Dùng Aleph khi chuyển động đến từ footage đầu vào của bạn và hướng sáng tạo đến từ prompt, với giá cố định 90 credit.

Vì sao chọn

Được xây quanh một video nguồn, nên nền chuyển động đến từ footage của bạn thay vì tạo trống

Phù hợp nhất cho
Chỉnh một clip nguồn đã duyệt sang art direction hoặc mood khác
Đầu vào
Văn bản / Tham chiếu / Video / Hình ảnh
Đầu ra
Video
Tín dụng
90 credit mỗi lần tạo
Biến đổi theo prompt với một ảnh tham chiếu tùy chọn để dẫn hướng phong cách hoặc chủ thểGiữ Aleph tách khỏi tạo Runway tiêu chuẩn 5 hoặc 10 giây từ text/image

Luma

Luma Modify Video

Video

Dự án rewrite source-video độc lập để đẩy một clip hiện có sang hướng thị giác mới. Dùng khi prompt cần biến đổi chính footage, chứ không chỉ làm bản xuất sắc nét hơn.

Vì sao chọn

Được thiết kế riêng cho rewrite source-video, không phải enhancement đơn giản

Phù hợp nhất cho
Chuyển một clip nguồn đã được duyệt sang mood, phong cách hoặc art direction khác
Đầu vào
Tham chiếu / Video
Đầu ra
Video
Tín dụng
30 credit mỗi lần tạo
Tốt nhất với clip ngắn, một mục tiêu rewrite và một prompt bắt đầu bằng tiếng AnhPhù hợp hơn upscaler khi diện mạo, không khí hoặc art direction cần thay đổi

xAI

Grok Imagine Video

Video

Mô hình video của xAI với các chế độ sáng tạo Fun/Normal/Spicy và 5 tỷ lệ khung hình. Các preset phong cách độc đáo cho nhiều sắc thái sáng tạo khác nhau — từ vui nhộn đến điện ảnh rồi táo bạo.

Vì sao chọn

Các chế độ sáng tạo Fun / Normal / Spicy độc đáo

Phù hợp nhất cho
Clip teaser giàu phong cách và chuyển động ưu tiên mạng xã hội
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
Từ 10 credit mỗi lần tạo
Hai tầng đầu ra 480p và 720p với tính phí theo giâyClip dài 6 đến 30 giây

OpenAI

Sora 2 Pro

Video

Tầng cao cấp của Sora 2 với chế độ chất lượng Standard/High, clip 10s/15s và tùy chọn xóa watermark. Chi tiết, ánh sáng và độ trung thực chuyển động được nâng cao cho sản xuất video chuyên nghiệp.

Vì sao chọn

Tầng chất lượng Standard và High cho nhu cầu sản xuất

Phù hợp nhất cho
Phim sản phẩm cao cấp và clip ra mắt
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
Từ 75 credit mỗi lần tạo
Chi tiết, ánh sáng và độ trung thực chuyển động được nâng caoClip 10s hoặc 15s với hỗ trợ prompt 10K ký tự

OpenAI

Sora 2

Video

Mô hình video của OpenAI cho text-to-video và image-to-video với mô phỏng thế giới chân thực, âm thanh đồng bộ, clip 10s/15s, đầu ra ngang/dọc và tùy chọn xóa watermark.

Vì sao chọn

Mô phỏng thế giới chính xác về vật lý

Phù hợp nhất cho
Teaser sản phẩm hoặc ra mắt ngắn có chất điện ảnh
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
Từ 6 credit mỗi lần tạo
Thời lượng clip 10s hoặc 15s với hỗ trợ prompt dài (10K ký tự)Tùy chọn hướng ngang và dọc

OpenAI

Sora Watermark Remover

Video

Mô hình hậu xử lý xóa watermark của Sora trên Rivya dành cho các liên kết chia sẻ Sora công khai đã hoàn thiện. Dùng sau khi video đã xong, khi nhiệm vụ còn lại là xóa watermark và chọn giao tới S3 hoặc OSS.

Vì sao chọn

Được xây riêng cho liên kết chia sẻ công khai `sora.chatgpt.com`, không phải video upload chung

Phù hợp nhất cho
Xóa watermark khỏi liên kết chia sẻ Sora công khai trước khi bàn giao
Đầu vào
Video
Đầu ra
Video
Tín dụng
3 credit mỗi lượt chạy
Giữ bước xóa watermark tách riêng khỏi tạo Sora 2 và Sora 2 ProChỉ có hai quyết định trên Rivya: URL video công khai và đích lưu trữ đầu ra

Topaz

Topaz Video Upscaler

Video

Trình upscale video cấp giao hàng của Topaz trên Rivya dành cho các clip đã được duyệt và chỉ cần rõ hơn khi xuất file. Dùng khi cảnh quay, chuyển động và timing đã đúng, còn vấn đề còn lại là độ phân giải hoặc độ sắc nét của file cuối.

Vì sao chọn

Phù hợp nhất với clip đã được duyệt, khi chỉ thiếu độ rõ hoặc độ phân giải giao hàng

Phù hợp nhất cho
Làm sắc clip đã được duyệt trước khi giao khách hàng, thuyết trình hoặc xuất bản
Đầu vào
Tham chiếu / Video
Đầu ra
Video
Tín dụng
12 credit mỗi lượt chạy
Dự án một video, không prompt, nên hữu ích như bước hoàn thiện sau dựngThang 1x, 2x và 4x đơn giản với tầng cố định 12 credit hiện tại

Google

Veo3.1 Quality

Video

Biến thể ưu tiên chất lượng của Google Veo 3.1 cho text-to-video premium và tạo dẫn dắt bằng hình ảnh. Hình ảnh trung thực hơn, chuyển động thực hơn và âm thanh nền mặc định khiến nó trở thành tùy chọn Veo cao cấp hơn của Rivya.

Vì sao chọn

Đường dẫn đầu ra Veo cao cấp hơn trên Rivya

Phù hợp nhất cho
Hero film ra mắt và spot thương hiệu premium
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
Từ 150 credit mỗi lần tạo
Phù hợp hơn với spot thương hiệu premium và cảnh heroÂm thanh nền được bao gồm mặc định

Google

Veo3.1 Fast

Video

Biến thể nhanh của Google Veo 3.1 với hỗ trợ ba chế độ: text-to-video, image-to-video và reference-to-video. Tối đa 3 ảnh tham chiếu, âm thanh native và điều khiển tỷ lệ khung hình theo từng chế độ giúp nó hữu ích cho các clip điện ảnh nhanh.

Vì sao chọn

Ba chế độ: text / image / reference-to-video

Phù hợp nhất cho
Ý tưởng quảng cáo nhanh có âm thanh native
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
Từ 20 credit mỗi lần tạo
Tối đa 3 ảnh tham chiếu cho tạo có dẫn hướngTạo âm thanh native cùng video

Google

Veo3.1 Lite

Video

Biến thể chi phí thấp nhất của Google Veo 3.1. Rivya hiện chỉ mở nhóm ổn định nhỏ nhất: text-to-video và image-to-video với giá cố định `10` credit mỗi lần tạo.

Vì sao chọn

Giá cố định 10 credit cho cả text-to-video và image-to-video trên Rivya

Phù hợp nhất cho
Thử nghiệm Veo chi phí thấp trước khi trả tiền cho tầng cao hơn
Đầu vào
Văn bản / Tham chiếu / Hình ảnh
Đầu ra
Video
Tín dụng
10 credit / lần tạo
Giữ luồng tạo Veo 3.1 cơ bản ở tầng chi phí thấp nhất hiện tạiHỗ trợ cả tạo chỉ bằng prompt và tạo dẫn dắt bằng hình ảnh

Suno

Suno Music

Âm thanh

Suno Music là mô hình text-to-music của Rivya để biến một brief ngắn thành bản nháp bài hát đầu tiên, có hoặc không có vocal. Nó giữ điểm vào cố định `12` credit và mở `Extend Music` làm bước tiếp theo sau khi track thành công.

Vì sao chọn

Giá cố định được ghi rõ là 12 credit mỗi lần tạo

Phù hợp nhất cho
Kiểm tra hướng bài hát trước khi cam kết một luồng sản xuất dài hơn
Đầu vào
Văn bản
Đầu ra
Âm thanh
Tín dụng
12 credit / lần tạo
Bản phát hành đầu giữ phạm vi hẹp thay vì mở toàn bộ họ Suno cùng lúcTrack thành công có thể tiếp tục qua hành động Extend Music

Suno

Suno Sounds

Âm thanh

Suno Sounds là mô hình text-to-sound nhẹ của Rivya cho ambience loop, âm thanh nền và phác thảo âm thanh ngắn. Nó giữ giá cố định được ghi rõ là `3` credit mỗi lần tạo và cho phép kết quả thành công tiếp tục sang `Vocal Separation`.

Vì sao chọn

Giá cố định được ghi rõ là 3 credit mỗi lần tạo

Phù hợp nhất cho
Tạo ambience bed, loop và ý tưởng âm thanh môi trường
Đầu vào
Văn bản
Đầu ra
Âm thanh
Tín dụng
3 credit / lần tạo
Bản phát hành đầu chỉ mở loop, BPM và Key như nhóm tham số rủi ro thấp nhấtGiữ chuỗi kết quả âm thanh Suno hiện tại với URL âm thanh tiêu chuẩn

Suno

Suno Lyrics

Âm thanh

Suno Lyrics là mô hình tạo lời bài hát của Rivya để biến một chủ đề hoặc tâm trạng thành lời ca với chi phí cố định `1` credit mỗi yêu cầu.

Vì sao chọn

Tạo lời bài hát cố định 1 credit

Phù hợp nhất cho
Phác thảo lời bài hát trước khi tạo một ca khúc đầy đủ
Đầu vào
Văn bản
Đầu ra
Âm thanh
Tín dụng
1 credit / lần tạo
Chỉ mở nhóm tham số prompt-only rủi ro thấp nhấtGiữ luồng tác vụ async trong khi vẫn cho phép thành công mà không có URL media

ElevenLabs

ElevenLabs Dialogue V3

Âm thanh

Mô hình đối thoại nhiều người nói của ElevenLabs trên Rivya. Mô hình được xây dựng cho tạo giọng nói theo vai, với gán giọng riêng cho từng nhân vật, điều khiển stability và nhịp đọc sẵn sàng cho đối thoại trong podcast, phỏng vấn và cảnh nhân vật.

Vì sao chọn

Tạo đối thoại nhiều người nói

Phù hợp nhất cho
Mở đầu podcast hai host và đoạn tranh luận
Đầu vào
Văn bản
Đầu ra
Âm thanh
Tín dụng
Credit dựa trên thời lượng hoặc độ dài
Gán giọng riêng cho từng nhân vậtStability có thể điều chỉnh để giữ cách đọc nhất quán

ElevenLabs

ElevenLabs Turbo 2.5

Âm thanh

Mô hình chuyển văn bản thành giọng nói tốc độ cao của ElevenLabs trên Rivya. Với khả năng tạo giọng độ trễ thấp cùng các điều khiển độ ổn định, độ tương đồng, phong cách và tốc độ, mô hình này phù hợp cho bản nháp lồng tiếng nhanh và dự án TTS tương tác.

Vì sao chọn

ElevenLabs TTS nhanh nhất — tối ưu cho độ trễ thấp

Phù hợp nhất cho
Lồng tiếng cho demo sản phẩm và phần hướng dẫn trong ứng dụng
Đầu vào
Văn bản
Đầu ra
Âm thanh
Tín dụng
Credit dựa trên thời lượng hoặc độ dài
Có thể điều chỉnh độ ổn định, độ tương đồng, phong cách và tốc độNhiều giọng preset với khả năng tạo có nhận biết ngữ cảnh

ElevenLabs

ElevenLabs Multilingual V2

Âm thanh

Mô hình text-to-speech đa ngôn ngữ của ElevenLabs trên Rivya, hỗ trợ khoảng 30 ngôn ngữ với tự động nhận diện. Đây là lựa chọn mạnh hơn cho bản địa hóa, phân phối xuyên ngôn ngữ và voiceover đa ngôn ngữ tự nhiên hơn.

Vì sao chọn

Tự động nhận diện và tạo khoảng 30 ngôn ngữ

Phù hợp nhất cho
Demo sản phẩm đã bản địa hóa và video onboarding
Đầu vào
Văn bản
Đầu ra
Âm thanh
Tín dụng
Credit dựa trên thời lượng hoặc độ dài
Ngữ điệu giống người và sắc thái giọng tinh tếCùng bộ điều khiển giọng: stability, similarity, style, speed

ElevenLabs

ElevenLabs Sound Effect V2

Âm thanh

Mô hình text-to-sound của ElevenLabs trên Rivya cho hiệu ứng ngắn, chuyển cảnh và loop ambience. Tạo clip âm thanh 0.5–22 giây với prompt influence có thể điều chỉnh, chế độ loop và 19 định dạng đầu ra cho dự án chỉnh sửa, sản phẩm hoặc game.

Vì sao chọn

Thời lượng âm thanh có thể cấu hình từ 0.5–22 giây

Phù hợp nhất cho
Tiếng click UI, âm báo và cue phản hồi trong app
Đầu vào
Văn bản
Đầu ra
Âm thanh
Tín dụng
Credit dựa trên thời lượng hoặc độ dài
Độ ảnh hưởng của prompt có thể điều chỉnhChế độ loop cho âm thanh lặp mượt

ElevenLabs

ElevenLabs Audio Isolation

Âm thanh

Mô hình dọn âm thanh và tách giọng của ElevenLabs trên Rivya. Tải lên một bản ghi để tách vocal, loại bỏ tiếng ồn nền và làm sạch âm thanh lời nói trước khi chỉnh sửa hoặc xuất bản.

Vì sao chọn

Tách âm thanh dựa trên tải lên — không cần prompt

Phù hợp nhất cho
Làm sạch bản ghi phỏng vấn hoặc podcast trước khi chỉnh sửa
Đầu vào
Tham chiếu / Âm thanh
Đầu ra
Âm thanh
Tín dụng
Credit dựa trên thời lượng hoặc độ dài
Tách vocal và loại bỏ tiếng ồn nềnTính phí theo thời lượng âm thanh

Đã tìm được vài mô hình đáng thử?

Lập danh sách rút gọn tại đây, rồi thử trong Rivya mà không phải đổi ứng dụng, ví thanh toán hoặc lịch sử dự án.
6 tín dụng khi đăng ký
Đăng ký nhanh