AI 模型目錄

先比較圖片、影片、音訊和聊天模型,再決定是否消耗點數

依任務、輸入、輸出、提供方和點數說明瀏覽 95+ 個 AI 模型。了解每個模型擅長什麼、查看真實範例,再把候選清單帶進 Rivya 實測。
6 註冊點數
快速註冊
圖片影片音訊對話聊天

模型目錄

依任務、輸入和輸出查找模型

依模態、輸入類型、提供方、優勢和點數說明縮小範圍。開啟模型頁即可查看真實輸出、任務適配度和快速線上試用。

4 類模型

全部模型

可依模型、廠商、能力或任務搜尋,再用事實篩選縮小頁面範圍,不必逐一開啟詳情頁。

95 個模型選項

先比較輸入、輸出、點數和範例提示,再決定要放進候選清單的模型。

比較模型適配度

依 Rivya 已為每個模型追蹤的欄位篩選:模態和支援輸入。任務適配度則由模型內容來源顯示在卡片上。

點數提示

每張模型卡都會顯示來自目錄內容的點數說明。

模態

支援輸入

95 個模型選項

先比較輸入、輸出、點數和範例提示,再決定要放進候選清單的模型。

4 類模型全部

適合先看的模型

從這裡開始

Alibaba

Z-Image

圖片

阿里巴巴的輕量文字轉圖片模型。以 1 點數即可快速生成單張圖片,支援 5 種長寬比,適合快速概念草稿和社群媒體視覺。

為什麼選它

每次生成 1 點數,是最低成本選項

最適合
便宜的第一版視覺概念
輸入
文字
輸出
圖片
點數
每次生成 1 點數起
快速單圖輸出,適合高速迭代乾淨的文字轉圖片流程,提供 5 種長寬比預設

Google

Nano Banana

圖片

Google 的靈活圖片模型,支援文字轉圖片和圖片轉圖片,包含 11 種長寬比、最多 10 張參考圖片,以及 PNG/JPEG 輸出。很適合人像、產品構圖和更寬的落地頁視覺。

為什麼選它

11 種長寬比,包含超寬 21:9 和自動模式

最適合
使用多個視覺參考的產品構圖
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 3 點數起
最多 10 張參考圖片用於引導創作PNG 和 JPEG 輸出格式選項

Black Forest Labs

Flux 2 Pro

圖片

Black Forest Labs 的 320 億參數旗艦模型。支援文生圖和圖生圖,最多 8 張參考圖、2K 解析度,以及精準的圖片內文字渲染,專為產品攝影和品牌視覺打造。

為什麼選它

最高 2K 解析度,呈現寫實材質

最適合
產品靜物圖和電商主視覺
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 5 點數起
準確渲染圖片中的文字和 Logo最多 8 張參考圖,用於保持風格和角色一致性

OpenAI

GPT-5.5

對話

OpenAI 在 Rivya 上的進階 GPT 對話模型,適合在任務簡報需要更多推理空間時處理複雜推理、圖像輔助分析、研究統整和結構化寫作。

為什麼選它

複雜推理和多步驟分析的上限更高

最適合
跨越冗長或零散來源資料的研究統整
輸入
文字
輸出
文字 / 推理
點數
按量付費 - 依使用量消耗點數
支援圖像輔助對話,最多 6 張圖片適合結構化簡報、研究統整與決策寫作

OpenAI

GPT-5.4

對話

OpenAI 在 Rivya 上更高階的 AI 對話模型,具備更強的結構化輸入處理、推理控制和工具導向對話專案能力,適合更複雜的分析與寫作任務。

為什麼選它

更強的複雜分析和多步驟規劃

最適合
長篇策略 brief 和決策備忘錄
輸入
文字
輸出
文字 / 推理
點數
按次使用付費 — 點數依使用量計算
支援視覺輸入,最多 6 張圖片適合結構化任務和工具導向對話

OpenAI

GPT-5.4 Codex

對話

OpenAI 在 Rivya 上更高階的 Codex 模型,為要求較高的 repo 級開發專案提供更強的程式碼能力、結構化推理和工具導向協作。

為什麼選它

更高階的 Codex 推理和程式碼協作

最適合
Repo 級除錯和架構審查
輸入
文字
輸出
文字 / 推理
點數
按量付費 — 依使用量消耗點數
保留 Responses project適合複雜程式碼、工具使用和多步驟技術工作

OpenAI

GPT-5.3 Codex

對話

OpenAI 在 Rivya 上最新、能力最強的 Codex 模型。它結合最先進的程式碼生成能力與更深入的代理式推理,適合最嚴苛的開發專案。

為什麼選它

OpenAI 能力最強的程式碼模型

最適合
大型程式碼庫中的高難度除錯
輸入
文字
輸出
文字 / 推理
點數
按次使用付費 — 點數依使用量計算
最先進的程式碼生成品質針對複雜問題提供最深入推理

OpenAI

GPT-5.2

對話

OpenAI 在 Rivya 上的旗艦 AI 對話模型,具備進階推理、最多 6 張圖片的視覺支援,以及 20K 字元 context window。它是適合研究、規劃、寫作和圖片感知分析的強力通用 GPT 選項。

為什麼選它

進階推理和複雜分析

最適合
策略備忘錄和決策文件
輸入
文字
輸出
文字 / 推理
點數
按次使用付費 — 點數依使用量計算
支援視覺輸入,可分析最多 6 張圖片20K 字元 context window

OpenAI

GPT-5.2 Codex

對話

OpenAI 在 Rivya 上更進階的 Codex 模型,為複雜工程任務提供更強推理。它針對長週期代理式編碼、架構決策,以及單純程式碼生成不足以處理的大型重構進行最佳化。

為什麼選它

複雜工程推理能力更強

最適合
架構審閱和系統設計取捨
輸入
文字
輸出
文字 / 推理
點數
按次使用付費 — 點數依使用量計算
最適合系統設計和架構12K output tokens,支援完整程式碼生成

OpenAI

GPT-5.1 Codex

對話

OpenAI 在 Rivya 上升級版的 Codex 模型,具備更高程式碼準確度,也為代理式編碼任務提供更強推理。它保留同一個長輸出、理解 repo 的專案,同時改善多文件重構和更安全的程式碼編修。

為什麼選它

程式碼準確度優於 GPT-5 Codex

最適合
多文件重構和遷移
輸入
文字
輸出
文字 / 推理
點數
按次使用付費 — 點數依使用量計算
更擅長多文件重構12K output token 上限,適合長程式碼生成

OpenAI

GPT-5 Codex

對話

OpenAI 在 Rivya 上的 GPT-5 Codex 程式碼專用模型,適合除錯、實作規劃、重構,以及支援視覺理解的技術問題求解。

為什麼選它

程式碼專用,具備 12K output token 上限

最適合
程式碼審查和錯誤修復
輸入
文字
輸出
文字 / 推理
點數
按量付費 — 依使用量消耗點數
針對程式碼生成和除錯最佳化支援視覺理解,可分析截圖/圖表

Google

Gemini 3.1 Pro

對話

Google 在 Rivya 上最新、能力最強的 Gemini AI 對話模型。具備頂級推理、視覺能力和指令遵循能力,是高要求分析與創意任務中最強的 Gemini 選項。

為什麼選它

Google 能力最強的 Gemini 模型

最適合
長 context 研究資料包和比較工作
輸入
文字
輸出
文字 / 推理
點數
按次使用付費 — 點數依使用量計算
頂級推理和指令遵循能力支援視覺輸入,最多 6 張圖片

Google

Gemini 3 Pro

對話

Google 在 Rivya 上深度更高的 Gemini AI 對話模型。推理能力比 Gemini 2.5 Pro 更強,並支援視覺輸入,更適合研究綜整、技術寫作和更審慎的多模態分析。

為什麼選它

推理能力優於 Gemini 2.5 Pro

最適合
長篇分析和結構化建議
輸入
文字
輸出
文字 / 推理
點數
按次使用付費 — 點數依使用量計算
支援視覺輸入,最多 6 張圖片擅長研究綜整和技術寫作

Google

Gemini 3 Flash

對話

Google 在 Rivya 上的新一代快速 AI 對話模型。token 成本比 Gemini 2.5 Flash 更低,推理能力也更強,專為高用量多模態對話、截圖分流和快速助理工作打造。

為什麼選它

所有對話模型中最低的 token 定價

最適合
快速多模態分流和截圖分析
輸入
文字
輸出
文字 / 推理
點數
按次使用付費 — 點數依使用量計算
推理能力優於 Gemini 2.5 Flash支援視覺輸入,最多 6 張圖片

Google

Gemini 2.5 Pro

對話

Google 在 Rivya 上更進階的 Gemini AI 對話模型。推理能力比 Flash 更強,支援視覺輸入和 20K context,適合研究綜整、文件分析和結構化寫作,每次使用 2 點數。

為什麼選它

推理能力比 Gemini Flash 更強

最適合
研究綜整和分析型寫作
輸入
文字
輸出
文字 / 推理
點數
按次使用付費 — 點數依使用量計算
支援視覺輸入,可分析最多 6 張圖片每次使用 2 點數,成本均衡

Google

Gemini 2.5 Flash

對話

Google 在 Rivya 上最快、也最實惠的 AI 對話模型。每次使用 1 點數,並支援最多 6 張圖片的視覺輸入,適合快速問答、初稿摘要、截圖分流和日常 AI 協助。

為什麼選它

最低成本的對話模型,僅 1 點數

最適合
快速研究查詢和初稿摘要
輸入
文字
輸出
文字 / 推理
點數
按次使用付費 — 點數依使用量計算
快速回應,適合即時對話支援視覺輸入,可分析最多 6 張圖片

Anthropic

Claude Opus 4.7

聊天

Anthropic 在 Rivya 上的旗艦 Claude 聊天模型,適合深度推理、謹慎整合、主管寫作和高影響力文字工作。

為什麼選它

旗艦級文字推理和整合能力

最適合
主管備忘錄和董事會風格敘事
輸入
文字
輸出
文字 / 推理
點數
按使用量付費 - 點數依用量計算
很適合長文分析和謹慎寫作Rivya 目前前端中的文字優先 Claude 專案

Anthropic

Claude Opus 4.6

聊天

Anthropic 在 Rivya 上的旗艦 Claude AI 聊天模型。它為深度推理、複雜分析和高品質寫作而設計,適合要求高、風險高的專案。

為什麼選它

旗艦級推理和複雜分析

最適合
主管備忘錄和高風險敘事寫作
輸入
文字
輸出
文字 / 推理
點數
按使用量付費 — 點數依用量計算
長文理解與輸出品質上限更高Rivya 目前前端中的文字優先 Claude 專案

Anthropic

Claude Sonnet 4.6

聊天

Anthropic 在 Rivya 上的均衡型 Claude AI 聊天模型。它保留強大的長文推理和謹慎分析,適合內容、研究和程式設計專案,同時不必直接跳到 Opus 層級的花費。

為什麼選它

可靠推理和均衡品質

最適合
審查長簡報、PRD 和策略文件
輸入
文字
輸出
文字 / 推理
點數
按使用量付費 — 點數依用量計算
強大的長文理解和多回合穩定性Rivya 目前前端中的文字優先 Claude 專案

Anthropic

Claude Opus 4.5

聊天

Anthropic 在 Rivya 上的旗艦 Claude AI 聊天模型。它擅長深度推理、複雜分析和專家級寫作,是處理關鍵 AI 任務時的高階選擇。

為什麼選它

Anthropic 最強的模型

最適合
深度研究整合和困難分析
輸入
文字
輸出
文字 / 推理
點數
按使用量付費 — 點數依用量計算
出色的深度推理和複雜分析專家級寫作和內容品質

Anthropic

Claude Sonnet 4.5

聊天

Anthropic 在 Rivya 上的均衡型 Claude AI 聊天模型。它擅長細膩寫作、謹慎分析和注重安全的回應,是內容創作和研究中很穩的 Claude 選項。

為什麼選它

細膩寫作和謹慎分析

最適合
編輯式改寫和語氣敏感的寫作
輸入
文字
輸出
文字 / 推理
點數
按使用量付費 — 點數依用量計算
注重安全且校準良好的回應Rivya 目前前端中的文字優先 Claude 專案

Anthropic

Claude Haiku 4.5

聊天

Anthropic 在 Rivya 上的輕量 Claude AI 聊天模型。它針對速度、成本效率和穩定的日常聊天表現調整,適合想要 Claude 語氣但不想使用高階方案成本的高頻專案。

為什麼選它

更適合低延遲、高頻使用

最適合
收件匣分流和快速內部問答
輸入
文字
輸出
文字 / 推理
點數
按使用量付費 — 點數依用量計算
token 定價比 Sonnet 或 Opus 低很多Rivya 目前前端中的文字優先 Claude 專案

Alibaba

Z-Image

圖片

阿里巴巴的輕量文字轉圖片模型。以 1 點數即可快速生成單張圖片,支援 5 種長寬比,適合快速概念草稿和社群媒體視覺。

為什麼選它

每次生成 1 點數,是最低成本選項

最適合
便宜的第一版視覺概念
輸入
文字
輸出
圖片
點數
每次生成 1 點數起
快速單圖輸出,適合高速迭代乾淨的文字轉圖片流程,提供 5 種長寬比預設

Google

Nano Banana 2

圖片

Google 的新一代圖片模型,具備 4K 解析度、15 種長寬比(包含極端 8:1)、Google Search 真實脈絡依據,以及最多 14 張參考圖片,是 Rivya 上最靈活的圖片生成器。

為什麼選它

最高 4K 解析度(可選 1K / 2K / 4K)

最適合
大尺寸圖片概念和全景式版面
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 5 點數起
15 種長寬比,包含極端 8:1 和 1:8 全景Google Search 真實脈絡依據可提供現實世界脈絡

Google

Nano Banana Pro

圖片

Google 的高階圖片模型,支援 4K 輸出、11 種長寬比和最多 8 張參考圖片。針對高保真品牌與行銷活動視覺最佳化,具備更好的細節和色彩準確度。

為什麼選它

最高 4K 解析度,保真度更高

最適合
高階品牌視覺和更高端的行銷圖片
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 8 點數起
11 種長寬比,包含自動偵測選項最多 8 張參考圖片以維持品牌一致性

Google

Nano Banana

圖片

Google 的靈活圖片模型,支援文字轉圖片和圖片轉圖片,包含 11 種長寬比、最多 10 張參考圖片,以及 PNG/JPEG 輸出。很適合人像、產品構圖和更寬的落地頁視覺。

為什麼選它

11 種長寬比,包含超寬 21:9 和自動模式

最適合
使用多個視覺參考的產品構圖
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 3 點數起
最多 10 張參考圖片用於引導創作PNG 和 JPEG 輸出格式選項

OpenAI

GPT Image 2

圖片

OpenAI 在 Rivya 上較新的 GPT Image 模型,支援 text-to-image、image-to-image、最多 16 張參考圖片,以及清楚的 1K / 2K / 4K 點數層級。

為什麼選它

在同一個 Rivya 模型頁支援 text-to-image 和 image-to-image

最適合
高解析度產品和活動視覺
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 3 點數起
1K、2K 和 4K 解析度層級,便於更清楚控制預算最多 16 張參考圖片,適合結構化編輯簡報

OpenAI

GPT Image 1.5

圖片

OpenAI 的圖片模型,具備中等/高品質兩個品質層級,並支援最多 16 張參考圖片。擅長遵循複雜指令,並渲染空間關係準確的連貫場景。

為什麼選它

最多 16 張參考圖片,是 Rivya 上最高的參考上限

最適合
指令密集的產品和活動視覺
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 4 點數起
中等和高品質層級,便於控制成本來自 OpenAI 語言模型的優秀提示詞理解能力

OpenAI

4o Image

圖片

OpenAI 的 4o Image 模型現在已在 Rivya 作為專用文生圖路徑提供。目前頁面設定刻意保持精簡:提示詞加上 3 種支援比例,並以固定每張圖片 3 點數計價。

為什麼選它

保留專用 OpenAI 4o Image 入口,而不是併入其他模型

最適合
從文字簡報快速生成概念視覺
輸入
文字
輸出
圖片
點數
每次生成 3 點數起
文生圖流程,對應列出的每張圖片 3 點數路徑三種已記錄的比例選項:1:1、3:2 和 2:3

ByteDance

Seedream 5.0 Lite

圖片

字節跳動較輕量的 Seedream 圖片模型,文字轉圖片和圖片編輯共用同一套價格。它支援 8 種長寬比、最多 14 張參考圖片,目前每次執行花費 6 點數。

為什麼選它

文字轉圖片和圖片轉圖片都採固定 6 點數價格

最適合
參考圖密集的行銷活動看板和情緒方向
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 6 點數起
最多 14 張參考圖片,適合引導式編輯專案8 種長寬比,包含超寬 21:9

ByteDance

Seedream 4.5

圖片

字節跳動的高階圖片模型,具備 2K/4K 品質級別、8 種長寬比,以及最多 14 張參考圖片。以電影感調色和豐富紋理細節見長,適合時尚和生活風格視覺。

為什麼選它

可選 2K(基本)和 4K(高品質)品質級別

最適合
時尚和生活風格行銷活動圖片
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 7 點數起
最多 14 張參考圖片用於引導創作8 種長寬比,包含超寬 21:9

ByteDance

Seedream 4.0

圖片

Seedream 4.0 是 Rivya 上均衡的字節跳動圖片模型,適合文字轉圖片生成、參考圖編輯,以及需要明確輸出控制的專案。

為什麼選它

一個模型位置同時覆蓋文字轉圖片和圖片編輯

最適合
生活風格視覺和編輯風格圖片草稿
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成固定 6 點數
保持公開 `image_resolution` 和 `max_images` 控制項可見編輯路徑支援最多 10 張參考圖片

ByteDance

Seedream 3.0

圖片

Seedream 3.0 現在作為獨立舊版圖片模型回到 Rivya。它目前只保留公開文字轉圖片路徑,每次執行花費 5 點數。

為什麼選它

讓 Seedream 3.0 作為自己的舊版文字轉圖片入口保留下來

最適合
想保留較早 Seedream 視覺方向的團隊
輸入
文字
輸出
圖片
點數
每次生成固定 5 點數
只暴露公開文件清楚顯示的參數子集比新版 Seedream 選項的參數介面更輕

xAI

Grok Imagine

圖片

xAI 的圖片模型,具備強烈創意詮釋能力和 5 種長寬比。單張圖片生成聚焦藝術表現和非傳統視覺風格。

為什麼選它

強烈的創意和藝術詮釋能力

最適合
大膽概念視覺和實驗性美術方向
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 4 點數起
具備不同於其他模型的獨特視覺風格支援文字轉圖片和圖片轉圖片

Black Forest Labs

Flux 2 Pro

圖片

Black Forest Labs 的 320 億參數旗艦模型。支援文生圖和圖生圖,最多 8 張參考圖、2K 解析度,以及精準的圖片內文字渲染,專為產品攝影和品牌視覺打造。

為什麼選它

最高 2K 解析度,呈現寫實材質

最適合
產品靜物圖和電商主視覺
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 5 點數起
準確渲染圖片中的文字和 Logo最多 8 張參考圖,用於保持風格和角色一致性

Black Forest Labs

Flux 2 Flex

圖片

Flux 2 系列中偏向編輯的變體。它擅長結構調整和風格轉換,最多支援 8 張參考圖與 2K 解析度,適合在既有視覺上反覆迭代。

為什麼選它

針對圖片編輯和風格轉換最佳化

最適合
編輯既有活動圖或產品圖
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 14 點數起
最多 8 張參考圖,用於引導式編修以 Flux 2 品質輸出 2K 解析度

Black Forest Labs

Flux Kontext Max

圖片

Black Forest Labs 強化版 Flux Kontext 模型,面向更高要求的提示詞生成和圖片編輯任務。Rivya 目前將文生圖和圖生圖保留在同一個非同步專案中,並依平台現行政策固定以每次 8 點數計價。

為什麼選它

Rivya 上生成與編輯皆採固定 8 點數定價

最適合
重要活動靜態主視覺的關鍵精修
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 8 點數起
面向更困難提示詞或編輯任務的高階 Kontext 檔位單一模型專案支援文生圖和單圖編輯

Black Forest Labs

Flux Kontext Pro

圖片

Black Forest Labs 較低成本的 Flux Kontext 專案,適合文生圖和單圖編輯。Rivya 目前在同一個非同步圖片專案中公開文生圖與圖生圖,並依現行平台定價政策,兩種模式皆採固定 4 點數計價。

為什麼選它

Rivya 上生成與編輯皆採固定 4 點數定價

最適合
從一張已核准來源圖製作廣告和社群變體
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 4 點數起
單一模型專案支援文生圖和單圖編輯內建翻譯開關,用於處理英文提示詞要求

Alibaba

Qwen2 Image

圖片

阿里巴巴的 Qwen2 圖片模型目前在 Rivya 上整合為一個固定價格圖片專案。它安全覆蓋文字轉圖片和圖片轉圖片,採用兩份公開文件都暴露的共同長寬比子集,並提供 PNG/JPEG 輸出、隨機種子重用和簡單 NSFW 開關。

為什麼選它

文字轉圖片和圖片轉圖片都採固定 6 點數價格

最適合
中文海報和行銷活動視覺
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 6 點數起
文字執行使用 `qwen2/text-to-image`,參考圖執行使用 `qwen2/image-edit`兩份公開 Qwen2 文件共用的安全長寬比子集

Alibaba

Qwen Image

圖片

阿里巴巴 Qwen 系列的圖片模型,具備 HD 預設(方形、直向、橫向)和 PNG/JPEG 輸出。擅長中文提示詞和具文化細節的視覺生成。

為什麼選它

HD 預設尺寸:方形、直向 4:3/16:9、橫向 4:3/16:9

最適合
中文行銷視覺
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 4 點數起
強大的中文提示詞理解PNG 和 JPEG 輸出格式選項

Midjourney

Midjourney

圖片

Midjourney 的 V7 圖像模型,支援文字轉圖片和圖片轉圖片,包含 Niji 動漫模式、3 種速度級別(Relaxed/Fast/Turbo)、風格參考,以及由 Omni Reference 驅動的一致性。它仍是電影感藝術、插畫和情緒板的標竿。

為什麼選它

無可匹敵的美學品質,仍是業界標竿

最適合
電影感概念藝術和情緒板
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 3 點數起
V7 + V6.1 + V6 + Niji 7/6 動漫模式3 種速度級別:Relaxed、Fast、Turbo

Recraft

Recraft Remove Background

圖片

Recraft 在 Rivya 上的去背景模型,適合從一張既有圖片中分離主體。當下一步需要透明素材、乾淨去背圖,或沒有原始背景的來源圖片時,可以使用它。

為什麼選它

單用途去背工具,固定 1 點數價格

最適合
在設計工作前,移除一張產品、人像或型錄圖片的背景
輸入
參考 / 圖片
輸出
圖片
點數
每次生成 1 點數起
針對一張上傳圖片設計,通常完全不需要提示詞很適合主體邊緣清楚的產品照、人像和其他素材

Recraft

Recraft Crisp Upscale

圖片

Recraft 在 Rivya 上的輕量圖片放大模型,適合對一張已確認的靜態圖片做低成本銳化和清晰度補強。當選定圖片只需要匯出前的便宜修飾,而不是更重的交付級放大時,可以使用它。

為什麼選它

針對單張上傳圖片的固定 1 點數清理步驟

最適合
替一張縮圖、社群圖或小尺寸產品圖快速提升清晰度
輸入
參考 / 圖片
輸出
圖片
點數
每次生成 1 點數起
適合發布或交付前,先做快速銳化和輕量放大不要求提示詞,也沒有尺寸階梯需要管理,因此很適合作為低摩擦預檢

Alibaba

Wan 2.7 Image Pro

圖片

阿里巴巴較高階的 Wan 2.7 圖片模型,目前在 Rivya 上作為文字轉圖片和圖片編輯的獨立圖片入口。透過明確限制每次生成單張輸出圖片,價格固定為每次執行 12 點數。

為什麼選它

文字轉圖片和圖片轉圖片都固定為 12 點數

最適合
品牌關鍵視覺和發布活動靜態圖
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 12 點數起
最多 9 張參考圖片,用於引導式編輯專案與 Wan 2.7 圖片家族共用控制,但有更清楚的高階級別

Alibaba

Wan 2.7 Image

圖片

阿里巴巴標準版 Wan 2.7 圖片模型在 Rivya 上作為自己的圖片入口,支援文字轉圖片和圖片編輯,目前每次執行需要 5 點數。

為什麼選它

目前每次執行需要 5 點數

最適合
多參考社群和活動草稿板
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 5 點數起
同時支援文字轉圖片和圖片轉圖片最多 9 張參考圖片,用於引導式編輯

Google

Google Imagen4 Ultra

圖片

Google Imagen4 Ultra 是 Rivya 高階的 Imagen 文生圖檔位。它目前以固定 12 點數的單張圖片專案整合,提供公開的提示詞、反向提示詞、長寬比和種子值控制。

為什麼選它

Rivya 上固定 12 點數定價

最適合
首頁主視覺和高階活動視覺
輸入
文字
輸出
圖片
點數
每次生成 12 點數起
高階 Google Imagen 文生圖檔位反向提示詞、長寬比和種子值控制

Google

Google Imagen4

圖片

Google Imagen4 是 Rivya 標準的 Imagen 文生圖檔位。它目前以固定 8 點數的單張圖片專案整合,提供公開的提示詞、反向提示詞、長寬比和種子值控制。

為什麼選它

Rivya 上固定 8 點數定價

最適合
網站主視覺圖和編輯插畫
輸入
文字
輸出
圖片
點數
每次生成 8 點數起
標準 Google Imagen 文生圖檔位反向提示詞、長寬比和種子值控制

Google

Google Imagen4 Fast

圖片

Google Imagen4 Fast 是 Rivya 輕量級的 Imagen 文生圖檔位。它目前保留單張圖片專案,採固定 4 點數定價,並公開提示詞、反向提示詞、長寬比和種子值控制,不開放多圖輸出。

為什麼選它

Rivya 上固定 4 點數定價

最適合
快速落地頁或部落格視覺方向
輸入
文字
輸出
圖片
點數
每次生成 4 點數起
輕量級 Google Imagen 文生圖入口反向提示詞、長寬比和種子值控制

Topaz

Topaz Image Upscaler

圖片

Topaz 在 Rivya 上的交付級圖片放大工具,適合已核准靜態圖需要真正提升尺寸時使用。當構圖已經定稿,剩下的問題是匯出解析度、審稿尺寸或印刷準備度時使用它。

為什麼選它

專為需要真正交付尺寸提升的已核准靜態圖而設,不是重新生成構圖

最適合
將已核准的電商、產品或活動靜態圖放大到更大的交付格式
輸入
參考 / 圖片
輸出
圖片
點數
每次執行 5 點數起
以 1、2、4 和 8 倍倍率建立清楚的介面級別,方便選擇尺寸和成本取捨當選定靜態圖已經定稿、輸出尺寸確實重要時,比 Recraft Crisp Upscale 更合適

Ideogram

Ideogram V3

圖片

Ideogram V3 是 Rivya 的 text-to-image 模型,適合文字渲染、海報版式和設計優先的圖片提示詞。目前價格為 TURBO 4 點數、BALANCED 7 點數、QUALITY 10 點數。

為什麼選它

渲染速度層級:TURBO、BALANCED、QUALITY

最適合
海報概念和標題導向廣告圖
輸入
文字
輸出
圖片
點數
每次生成 4 點數起
設計導向的 Ideogram V3 圖片生成MagicPrompt 擴展開關

Ideogram

Ideogram V3 Reframe

圖片

Ideogram V3 Reframe 目前在 Rivya 以單圖重構專案接入,並按渲染速度定價。目前價格為 TURBO 4 點數、BALANCED 7 點數、QUALITY 10 點數。

為什麼選它

渲染速度層級:TURBO、BALANCED、QUALITY

最適合
把一張已核准視覺調整為新的長寬比
輸入
參考 / 圖片
輸出
圖片
點數
每次生成 4 點數起
單張圖片重構專案這個模型的提示詞可選填

Ideogram

Ideogram V3 Remix

圖片

Ideogram V3 Remix 目前在 Rivya 以單圖 remix 專案接入,並按渲染速度定價。目前價格為 TURBO 4 點數、BALANCED 7 點數、QUALITY 10 點數。

為什麼選它

渲染速度層級:TURBO、BALANCED、QUALITY

最適合
從一張來源圖片探索替代美術方向
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 4 點數起
單張圖片 remix 專案MagicPrompt、強度和負向提示詞控制

Ideogram

Ideogram Character

圖片

面向角色一致性的選項,可把一張已核准的角色圖片延展到新場景、服裝和格式。當身份保留比廣泛圖片編輯更重要,且一次只需要一張輸出圖片時使用它。

為什麼選它

以單張參考圖為核心,專為讓一個角色在新場景中保持可辨識而調整

最適合
讓一個吉祥物、頭像或插畫角色在多個新場景中保持可辨識
輸入
文字 / 參考 / 圖片
輸出
圖片
點數
每次生成 12 點數起
與 Ideogram V3、Reframe 和 Remix 分開,讓使用者能在更廣泛的編輯自由之外選擇一致性可預期的單張圖片輸出,並具備 TURBO、BALANCED 和 QUALITY 點數層級

ByteDance

Seedance 2.0

影片

字節跳動完整的 Seedance 2.0 影片模型,明確支援純提示詞生成、畫面驅動動畫和多模態參考生成。Rivya 保持文件中的角色拆分清楚可見,讓畫面輸入和多模態參考彼此互斥,而不是混成一個模糊的上傳區。

為什麼選它

完整 Seedance 2.0 場景拆分:文字、畫面和多模態參考

最適合
從提示詞、畫面或參考組合產生更高品質短片
輸入
文字
輸出
影片
點數
每次執行 64 點數起
在同一個模型中處理提示詞引導、畫面引導和多模態參考專案480p 和 720p 輸出,並支援自適應長寬比

ByteDance

Seedance 2.0 Fast

影片

字節跳動更快的 Seedance 2.0 影片模型,具備完整場景路由,可用於純提示詞生成、畫面驅動的圖片動畫,以及多模態參考影片生成。Rivya 保持文件中的場景拆分清楚可見,避免首幀/尾幀輸入與參考圖片、影片和音訊角色混淆。

為什麼選它

完整 Seedance 2.0 Fast 場景拆分:文字、畫面和多模態參考

最適合
從提示詞或分鏡畫面快速製作廣告預演
輸入
文字
輸出
影片
點數
每次執行 52 點數起
480p 和 720p 輸出,並支援自適應長寬比可選同步音訊生成和最後一幀返回

ByteDance

Seedance 1.5 Pro

影片

字節跳動的旗艦影片模型,支援文字轉影片和圖片轉影片,並具備原生音畫同步。480p-1080p、4-12 秒片段、6 種長寬比、動態/固定鏡頭控制、可選音訊生成,以及唇形同步支援。

為什麼選它

原生音畫同步,具備精準唇形同步

最適合
需要對白和動作同步的短片
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 28 點數起
480p / 720p / 1080p 解析度選項4 秒、8 秒或 12 秒可設定片段時長

ByteDance

Seedance 1.0 Pro

影片

字節跳動的 Seedance 1.0 Pro 模型,在 Rivya 上作為標準 1.0 Pro 選項,同時支援文字轉影片和圖片轉影片。它讓目前頁面設定與公開 V1 Pro 文件保持一致,提供解析度、時長、鏡頭鎖定、隨機種子和安全檢查控制。

為什麼選它

同時支援文字轉影片和圖片轉影片

最適合
短電影感片段
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 25 點數起
480p、720p 和 1080p 輸出級別5 秒和 10 秒時長控制

ByteDance

Seedance 1.0 Pro Fast

影片

字節跳動的快速圖生影片模型。可將單張參考圖片動畫化為 720p/1080p 的 5 秒或 10 秒片段,當你需要快速從靜態圖得到影片時,它為速度最佳化。

為什麼選它

圖生影片專用,周轉速度快

最適合
快速靜態圖轉影片動畫
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 16-72 點數
720p 和 1080p 解析度選項5 秒或 10 秒片段時長

ByteDance

Seedance 1.0 Lite

影片

字節跳動的 Seedance 1.0 Lite 模型在 Rivya 上作為較輕量的 1.0 選項,同時支援文字轉影片和圖片轉影片。它遵循公開 V1 Lite 參數集,目前使用比 Seedance 1.0 Pro 更低的價格級距。

為什麼選它

同時支援文字轉影片和圖片轉影片

最適合
較低成本的分鏡測試
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 16 點數起
價格低於 Seedance 1.0 Pro圖片轉影片模式可選第二張圖片作為尾幀

HappyHorse

HappyHorse 1.0

影片

Rivya 上靈活的 AI 影片模型,可從同一個公開模型頁處理 text-to-video、單張圖片動態、多圖參考影片,以及影片編輯。

為什麼選它

一個模型頁涵蓋文字、圖片、參考和影片編輯工作流

最適合
從書面簡報製作短篇廣告或產品動態草稿
輸入
文字 / 參考 / 圖片 / 影片
輸出
影片
點數
每次生成 28 點數起
支援 720p 和 1080p 固定價格輸出層級未附加影片時接受最多 9 張圖片參考

Alibaba

Wan 2.7 Video

影片

阿里巴巴較新的 Wan 影片系列,依解析度與時長計費。Rivya 目前在同一個模型位置開放文字轉影片、圖片轉影片和影片編輯,5s 720p 從 80 點數起。

為什麼選它

按解析度與時長計費:720p = 16 點數/秒,1080p = 24 點數/秒

最適合
短片產品宣傳片和社群短版剪輯
輸入
文字 / 參考 / 圖片 / 影片
輸出
影片
點數
每次生成 80 點數起
一個模型位置支援文字轉影片、圖片轉影片和影片編輯圖片轉影片可使用一張圖片或首尾幀成對圖片

Alibaba

Wan 2.6

影片

阿里巴巴在 Rivya 上的三模式 Wan 選項:文字轉影片、圖片轉影片和來源影片編輯都在同一個專案中。它支援 720p/1080p、5 到 15 秒片段,並且一次使用一張圖片或一段來源影片。

為什麼選它

三種模式:文字轉影片 + 圖片轉影片 + 影片轉影片

最適合
從既有來源片段進行影片轉影片編輯
輸入
文字 / 參考 / 圖片 / 影片
輸出
影片
點數
每次生成 70 點數起
較重的 Wan 選項,可從來源影片開始,而不只限於文字或靜態圖一張圖片或一段來源影片讓編輯路徑保持明確

Alibaba

Wan 2.5 Video

影片

Wan 2.5 目前在 Rivya 上作為文字轉影片和圖片轉影片的共用入口。現行價格為 `720p_5 = 60`、`720p_10 = 120`、`1080p_5 = 100`、`1080p_10 = 200` 點數。

為什麼選它

一個模型位置同時支援文字轉影片和圖片轉影片

最適合
從文字或一張主視覺生成 5 秒或 10 秒 Wan 宣傳片
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 60 點數起
商業價格按解析度與時長分成四個可見級別保留既有非同步影片結果鏈,不新增結果類型

Alibaba

Wan 2.2 A14B Turbo

影片

Wan 2.2 A14B Turbo 目前在 Rivya 上同時涵蓋文字轉影片、圖片轉影片,以及由一張圖片加一段音訊驅動的影片路徑。現行價格為文字或圖片生成 `480p = 8`、`720p = 12`,圖片加音訊驅動時為 `480p = 16`、`580p = 20`、`720p = 24`。

為什麼選它

一個模型位置同時涵蓋文字、圖片和圖片加音訊驅動影片生成

最適合
較輕量的 Wan 文字轉影片實驗
輸入
文字 / 參考 / 圖片 / 音訊
輸出
影片
點數
每次生成 8 點數起
商業價格在較輕的文字/圖片生成和較重的圖片加音訊驅動生成之間分層圖片加音訊驅動路徑保留自己的進階參數子集,而不是全部折回預設值

Alibaba

Wan Animate Replace

影片

Wan 在 Rivya 上的角色替換影片模型,用於替換既有片段中出現的人物或主體。當動作已經正確、只需要改變可見主體時,使用一個公開來源影片 URL、一個公開替換圖片 URL 和一個解析度級別即可。

為什麼選它

保留公開的 `video_url + image_url + resolution` 形狀,而不是建立提示詞很重的專案

最適合
在保留來源片段動作的前提下替換畫面中的主體或角色
輸入
影片
輸出
影片
點數
每次生成 12 點數起
最適合原始動作應保持不變的主體或角色替換當兩個素材都已在公開儲存空間、可由上游抓取時效果最好

MiniMax

Hailuo 2.3

影片

MiniMax 的 image-to-video 模型,具備 Standard/Pro 品質層級、768P/1080P 解析度,以及 6 秒或 10 秒短片。以從靜態圖片產生更順暢動作和自然轉場而聞名。

為什麼選它

Standard 和 Pro 品質層級

最適合
把人像或時尚靜態圖轉成動態
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 25 點數起
768P 和 1080P 解析度選項6 秒或 10 秒可設定短片時長

MiniMax

Hailuo Pro

影片

MiniMax 較舊的 Hailuo Pro 影片模型在這裡以固定 Pro 層級接入,同時支援文字轉影片和圖片轉影片。圖片模式接受 1 或 2 張參考圖片,第二張圖片會作為尾幀使用,目前每次生成消耗 57 點數。

為什麼選它

同一模型支援文字轉影片和圖片轉影片

最適合
從一張關鍵視覺製作較高品質的動態草稿
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 57 點數
圖片模式支援首幀,或首幀加尾幀的一組圖片接入公開確認的固定 Pro 層級

MiniMax

Hailuo Standard

影片

MiniMax 較舊的 Hailuo Standard 影片模型,在這裡統一作為同時支援文字轉影片和圖片轉影片的一個模型。圖片模式接受 1 或 2 張參考圖片,第二張圖片會作為尾幀使用,目前已驗證的公開價格層級為 12 到 50 點數。

為什麼選它

同一模型支援文字轉影片和圖片轉影片

最適合
把一張主視覺轉成短篇動態預告
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 12-50 點數
圖片模式支援首幀,或首幀加尾幀的一組圖片512P 和 768P 圖片驅動層級

Kuaishou

Kling 3.0

影片

快手的高階影片模型,支援文生影片與圖生影片,提供 Standard (720P) / Pro (1080P) 級別、單鏡頭或多鏡頭結構、3-15 秒時長、可選音訊生成,以及最多 2 張參考圖。

為什麼選它

Standard (720P) 和 Pro (1080P) 品質級別

最適合
有明確鏡頭規劃的分鏡式廣告預演
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 42 點數起
單鏡頭或多鏡頭生成模式彈性的 3-15 秒片段時長

Kuaishou

Kling 3.0 motion-control

影片

更新一代的 Kling motion-control 選項,可用一張參考圖加一段動作影片驅動單一主體,並明確選擇背景來源。當你需要動作遷移,同時也想更強地控制場景應來自影片或圖片時,適合使用它。

為什麼選它

明確的 1 張圖片 + 1 段動作影片專案,讓身份和動作角色保持清楚

最適合
需要選擇背景來自動作影片或參考圖的動作遷移任務
輸入
文字 / 參考 / 圖片 / 影片
輸出
影片
點數
每次生成 20 點數起
在角色朝向之外加入 `background_source`,這是相對 Kling 2.6 motion-control 的主要升級Standard (720P) 和 Pro (1080P) 固定價格為 20 / 27 點數

Kuaishou

Kling 2.6

影片

快手的影片模型,支援可選音訊生成、5 秒 / 10 秒片段和 3 種長寬比。擅長人物動作和富有表現力的角色動畫,並具備自然的物理效果。

為什麼選它

可選擇隨影片生成音訊

最適合
角色表演和富有表現力的動作
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 55 點數起
5 秒或 10 秒片段時長3 種長寬比:1:1、16:9、9:16

Kuaishou

Kling 2.6 motion-control

影片

這是專為動作遷移設計的專案,可用一張參考圖加一段動作影片驅動單一主體。當你想用較低成本完成 Kling motion-control 測試,且不需要 Kling 3.0 motion-control 額外的場景控制時,適合使用它。

為什麼選它

明確的 1 張圖片 + 1 段動作影片專案,因此身份來源和動作來源都很清楚

最適合
用一張靜態角色圖加一段獨立動作參考片段驅動單一角色
輸入
文字 / 參考 / 圖片 / 影片
輸出
影片
點數
每次生成 16 點數起
比 Kling 3.0 motion-control 更低成本,為 16 / 22 點數提示詞可選,讓上傳的動作片段保持主要驅動地位

Kuaishou

Kling V2.5 Turbo Pro

影片

快手的 Kling V2.5 Turbo Pro 影片模型,現在同時支援文字轉影片和圖片轉影片。公開價格證據清楚涵蓋文字和圖片兩種 5 秒與 10 秒級別,因此 Rivya 直接映射為 42 / 84 點數。

為什麼選它

文字和圖片級別都有清楚的公開價格證據

最適合
從文字或首尾幀開始的短廣告預演
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 42-84 點數
文字和圖片生成共用一個對齊的模型項目圖片模式支援首幀加可選尾幀

Kuaishou

Kling V2.1 Master

影片

快手較舊的 Kling V2.1 Master 影片模型現在在 Rivya 上同時支援文生影片和圖生影片。目前價格為 5 秒 160 點數,10 秒 320 點數。

為什麼選它

固定的 5 秒和 10 秒價格級別

最適合
將舊版 Kling Master 與更新級別做比較
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 160-320 點數
文字和圖片生成目前共用一個對齊的模型項目文字保留 `aspect_ratio`,圖片則只使用文檔支持的欄位

Kuaishou

Kling V2.1 Pro

影片

快手較舊的 Kling V2.1 Pro 圖生影片模型支援首幀加可選尾幀圖片。目前價格為 5 秒 50 點數,10 秒 100 點數。

為什麼選它

僅限圖生影片,專案範圍更窄

最適合
前後狀態或起始與結尾幀鏡頭測試
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 50-100 點數
支援首幀和可選尾幀固定的 5 秒和 10 秒價格級別

Kuaishou

Kling V2.1 Standard

影片

快手較舊的 Kling V2.1 Standard 圖生影片模型。目前價格為 5 秒 25 點數,10 秒 50 點數。

為什麼選它

僅限圖生影片

最適合
將一張產品靜態圖做成快速動態測試
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 25-50 點數
固定的 5 秒和 10 秒價格級別支援 `negative_prompt` 和 `cfg_scale`

Kuaishou

Kling AI Avatar Pro

影片

快手的 Kling AI Avatar Pro 高品質說話頭像模型,使用一張人物肖像加一段音訊生成口型同步的頭像影片。Rivya 目前以固定每次生成 16 點數計價。

為什麼選它

固定的人物肖像加音訊高品質說話頭像專案

最適合
更高品質的說話頭像影片
輸入
文字 / 參考 / 圖片 / 音訊
輸出
影片
點數
每次生成 16 點數
在 Rivya 上固定 16 點數計價更適合品質優先的口型同步輸出

Kuaishou

Kling AI Avatar Standard

影片

快手的 Kling AI Avatar Standard 說話頭像模型,使用一張人物肖像加一段音訊生成口型同步的頭像影片。Rivya 目前以固定每次生成 8 點數計價。

為什麼選它

固定的人物肖像加音訊說話頭像專案

最適合
說話頭像影片
輸入
文字 / 參考 / 圖片 / 音訊
輸出
影片
點數
每次生成 8 點數
在 Rivya 上固定 8 點數計價直接明確的口型同步路徑

MeiGen-AI

Infinitalk

影片

Infinitalk 是一款以人物肖像和音訊驅動的說話影片模型。目前費用按解析度和音訊時長計算:480p = 每秒 3 點數,720p = 每秒 12 點數。

為什麼選它

固定的人物肖像加音訊說話影片專案

最適合
說話頭像影片
輸入
文字 / 參考 / 圖片 / 音訊
輸出
影片
點數
每秒 3 或 12 點數
點數依解析度和已驗證的音訊時長計算支援 480p 和 720p 輸出級別

Runway

Runway

影片

Runway 是一個獨立影片模型,同時支援文字轉影片和圖片轉影片。公開價格證據目前只確認 6 個生成級別,因此 Rivya 保持在已驗證集合:`720p_5 = 12`、`720p_10 = 30`、`1080p_5 = 30`。

為什麼選它

文字和圖片級別都有清楚的公開價格證據

最適合
5 秒上市預告和社群廣告
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 12-30 點數
文字生成和圖片生成共用同一個對齊的模型條目文字模式保留 `aspectRatio`,圖片模式則沿用來源圖片比例

Runway

Runway Aleph

影片

面向來源影片轉換的專案,可將既有片段改寫成新的視覺結果。當動作來自你的輸入素材、創意方向由提示詞決定,且需要固定 90 點數價格時,請使用 Aleph。

為什麼選它

圍繞一段來源影片建立,因此動作基礎來自你的素材,而不是空白生成

最適合
將已核准的來源片段改寫成不同美術方向或氛圍
輸入
文字 / 參考 / 影片 / 圖片
輸出
影片
點數
每次生成 90 點數
提示詞引導轉換,並可加入一張可選參考圖輔助風格或主體方向將 Aleph 和標準 Runway 5 秒或 10 秒文字/圖片生成清楚分開

Luma

Luma Modify Video

影片

獨立的來源影片改寫專案,用於將一段現有片段推向新的視覺方向。當提示詞應轉化素材本身,而不只是讓匯出結果更清晰時,適合使用它。

為什麼選它

專為來源影片改寫而設計,不是單純增強

最適合
將一段已通過的來源片段轉成不同情緒、風格或美術方向
輸入
參考 / 影片
輸出
影片
點數
每次生成 30 點數
最適合短片段、單一改寫目標和一條英文優先提示詞當外觀、氛圍或美術方向需要改變時,比升頻工具更合適

xAI

Grok Imagine Video

影片

xAI 的影片模型,具備 Fun/Normal/Spicy 創意模式和 5 種長寬比。以獨特風格預設對應不同創意調性,從玩味、電影感到更前衛的方向都能覆蓋。

為什麼選它

獨特的 Fun / Normal / Spicy 創意模式

最適合
風格化預告短片和社群優先動態
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 10 點數起
480p 和 720p 輸出層級,並按秒計費6 到 30 秒短片

OpenAI

Sora 2 Pro

影片

Sora 2 的高階級別,具備標準/高品質模式、10 秒/15 秒片段,以及水印移除。細節、光線和動作保真度更強,適合專業影片製作。

為什麼選它

適合製作用途的標準和高品質級別

最適合
高階產品影片和發表片段
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 75 點數起
更強的細節、光線和動作保真度10 秒或 15 秒片段,支援 10K 字元提示詞

OpenAI

Sora 2

影片

OpenAI 的影片模型,支援文字轉影片和圖片轉影片,具備真實世界模擬、同步音訊、10 秒/15 秒片段、橫向/直向輸出,以及可選水印移除。

為什麼選它

物理精準的世界模擬

最適合
短電影感產品或發表預告
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 6 點數起
10 秒或 15 秒片段時長,支援長提示詞 (10K 字元)橫向和直向方向選項

OpenAI

Sora Watermark Remover

影片

Sora 在 Rivya 上的水印移除後處理模型,適用於已完成的公開 Sora 分享連結。請在影片本身已完成、剩餘工作只是移除水印並選擇 S3 或 OSS 交付時使用它。

為什麼選它

專為公開 `sora.chatgpt.com` 分享連結建立,不是一般上傳影片工具

最適合
交付前移除公開 Sora 分享連結中的水印
輸入
影片
輸出
影片
點數
每次執行 3 點數
將水印移除和 Sora 2 / Sora 2 Pro 生成清楚分開在 Rivya 上只有兩個決策:公開影片 URL 和輸出儲存目標

Topaz

Topaz Video Upscaler

影片

Topaz 在 Rivya 上的交付級影片放大工具,適合已核准片段只需要在匯出時提升清晰度時使用。當鏡頭、動作和節奏都已經正確,剩下的問題是解析度或最終檔案銳利度時使用它。

為什麼選它

最適合內容已核准、只缺清晰度或交付解析度的片段

最適合
在客戶交付、簡報或發布前銳化已核准片段
輸入
參考 / 影片
輸出
影片
點數
每次執行 12 點數
單影片、無提示詞專案,適合作為剪輯後的收尾步驟簡單的 1x、2x、4x 級別搭配目前固定 12 點數價格

Google

Veo3.1 Quality

影片

Google Veo 3.1 的品質優先變體,適合高階文字轉影片和圖片引導生成。更高保真的畫面、更強的動作真實感,以及預設背景音訊,使它成為 Rivya 上更高階的 Veo 選項。

為什麼選它

Rivya 上更高階的 Veo 輸出路徑

最適合
主視覺發布影片和高階品牌短片
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 150 點數起
更適合高階品牌短片和主視覺場景預設包含背景音訊

Google

Veo3.1 Fast

影片

Google Veo 3.1 的快速變體,支援三種模式:文字轉影片、圖片轉影片、參考圖轉影片。最多 3 張參考圖、原生音訊,以及依模式調整的長寬比控制,讓它適合快速製作電影感短片。

為什麼選它

三種模式:文字 / 圖片 / 參考圖轉影片

最適合
帶原生音訊的快速廣告概念
輸入
文字 / 參考 / 圖片
輸出
影片
點數
每次生成 20 點數起
最多 3 張參考圖用於引導生成影片可搭配原生音訊生成

Google

Veo3.1 Lite

影片

Google Veo 3.1 的最低成本變體。Rivya 目前只開放最小穩定子集:文字轉影片和圖片轉影片,固定每次生成 `10` 點數。

為什麼選它

在 Rivya 上,文字轉影片和圖片轉影片都固定為 10 點數

最適合
在支付更高級別成本前進行低成本 Veo 實驗
輸入
文字 / 參考 / 圖片
輸出
影片
點數
10 點數 / 次生成
以目前最低成本級別保留 Veo 3.1 基礎生成流程同時支援純提示詞和圖片驅動生成

Suno

Suno Music

音訊

Suno Music 是 Rivya 的文字轉音樂模型,可將一段簡短需求轉成有人聲或純音樂的第一版歌曲草稿。它保留固定 `12` 點數入口,並在音軌成功生成後提供 `Extend Music` 作為下一步。

為什麼選它

明確記錄每次生成固定 12 點數

最適合
在投入較長製作流程前測試歌曲方向
輸入
文字
輸出
音訊
點數
12 點數 / 次生成
首版範圍保持聚焦,不一次開放完整 Suno 家族成功音軌可繼續透過 Extend Music 動作延伸

Suno

Suno Sounds

音訊

Suno Sounds 是 Rivya 的輕量文字轉聲音模型,適合環境聲循環、背景音和短聲音草稿。它保留已記錄的固定價格:每次生成 `3` 點數,並允許成功結果繼續進入 `Vocal Separation`。

為什麼選它

明確記錄每次生成固定 3 點數

最適合
生成環境聲底、循環和環境聲音想法
輸入
文字
輸出
音訊
點數
3 點數 / 次生成
首版只開放循環、BPM 和調號這組最低風險參數保留目前 Suno 音訊結果鏈,使用標準音訊 URL

Suno

Suno Lyrics

音訊

Suno Lyrics 是 Rivya 的歌詞生成模型,可將一個主題或情緒轉成歌曲文字,每次請求固定花費 `1` 點數。

為什麼選它

固定 1 點數的歌詞生成

最適合
生成完整歌曲前先草擬歌詞
輸入
文字
輸出
音訊
點數
1 點數 / 次生成
只暴露最低風險的純提示詞參數子集保留非同步任務流程,同時允許沒有媒體 URL 也能成功

ElevenLabs

ElevenLabs Dialogue V3

音訊

ElevenLabs 在 Rivya 上的多說話者對白模型。它為角色式語音生成而設計,支援個別語音分配、穩定性控制,以及適合 Podcast、訪談和角色場景的對白節奏。

為什麼選它

多說話者對白生成

最適合
雙主持 Podcast 開場和辯論段落
輸入
文字
輸出
音訊
點數
點數依時長或長度計算
每個角色可分配個別語音可調整穩定性以保持一致表現

ElevenLabs

ElevenLabs Turbo 2.5

音訊

ElevenLabs 在 Rivya 上的快速文本轉語音模型。它提供低延遲語音生成,並可調整穩定性、相似度、風格和速度,適合快速製作旁白草稿與互動式 TTS 專案。

為什麼選它

最快的 ElevenLabs TTS,針對低延遲最佳化

最適合
產品展示和 App walkthrough 旁白
輸入
文字
輸出
音訊
點數
點數依時長或長度計算
可調整穩定性、相似度、風格和速度多種語音預設,支援情境感知生成

ElevenLabs

ElevenLabs Multilingual V2

音訊

ElevenLabs 在 Rivya 上的多語文本轉語音模型,支援約 30 種語言並可自動偵測。它更適合在地化、跨語言交付,以及更自然的多語 voiceover。

為什麼選它

自動偵測並生成約 30 種語言

最適合
在地化產品展示和 onboarding 影片
輸入
文字
輸出
音訊
點數
點數依時長或長度計算
接近真人的語調和細膩語氣相同語音控制項:stability、similarity、style、speed

ElevenLabs

ElevenLabs Sound Effect V2

音訊

ElevenLabs 在 Rivya 上的文本轉聲音模型,適合短音效、轉場和環境循環。可生成 0.5–22 秒音訊片段,並調整提示詞影響、循環模式和 19 種輸出格式,用於剪輯、產品或遊戲專案。

為什麼選它

可設定 0.5–22 秒音訊時長

最適合
UI 點擊聲、通知聲和應用程式回饋提示
輸入
文字
輸出
音訊
點數
點數依時長或長度計算
可調整提示詞影響強度支援循環模式,生成可無縫重複的音訊

ElevenLabs

ElevenLabs Audio Isolation

音訊

ElevenLabs 在 Rivya 上的音訊清理與語音隔離模型。上傳一段錄音即可分離人聲、移除背景噪音,並在編輯或發布前清理 spoken audio。

為什麼選它

上傳式音訊隔離,不需要提示詞

最適合
編輯前清理訪談或 Podcast 錄音
輸入
參考 / 音訊
輸出
音訊
點數
點數依時長或長度計算
人聲分離和背景噪音移除依音訊時長計量計費

已經找到幾個值得試的模型?

先在這裡列出候選模型,再到 Rivya 內實際測試,不必在不同應用程式、錢包或專案歷史之間切換。
6 註冊點數
快速註冊