AI 模型目录

先比较图片、视频、音频和对话模型,再决定消耗积分

按任务、输入、输出、提供方和积分提示浏览 95+ 个 AI 模型。先看每个模型适合什么、真实示例像什么,再把候选带进 Rivya 试跑。
新用户送 6 积分
几秒完成注册
图片视频音频对话

模型目录

按任务、输入和输出查找模型

按模态、输入类型、提供方、优势和积分提示缩小范围。进入模型页后,可以查看真实输出、任务适配度和在线试用入口。

4 类模型

全部模型

可以按模型、厂商、能力或任务搜索,再用事实筛选缩小范围,不必逐个打开详情页。

95 个模型候选

先比较输入、输出、积分和示例提示,再决定真正要带进候选清单的模型。

比较模型适配度

只按 Rivya 已经为每个模型记录的字段筛选:模态和支持输入。任务适配来自模型内容源,并显示在卡片上。

积分提示

每张模型卡都会显示来自目录内容的积分说明。

模态

支持输入

95 个模型候选

先比较输入、输出、积分和示例提示,再决定真正要带进候选清单的模型。

4 类模型全部

适合先看的模型

先看这个

Alibaba

Z-Image

图片

阿里巴巴轻量级文生图模型,支持 5 种宽高比,1 积分即可快速出图,适合概念草图和社交媒体素材。

推荐理由

全站最低成本,1 积分即可生成

适合任务
低成本初步视觉概念图
输入
文本
输出
图片
积分
每次生成约 1 积分起
单图快速输出,适合快速迭代纯文生图,支持 5 种宽高比预设

Google

Nano Banana

图片

Google 的灵活图片模型,支持文生图、图生图、11 种宽高比、最多 10 张参考图,以及 PNG/JPEG 输出,适合人像、产品构图和更宽画幅的营销视觉。

推荐理由

11 种宽高比,含超宽 21:9 和自动模式

适合任务
多参考图驱动的产品构图
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 3 积分起
最多 10 张参考图引导创作支持 PNG 和 JPEG 输出格式

Black Forest Labs

Flux 2 Pro

图片

Black Forest Labs 旗舰 320 亿参数模型,支持文生图和图生图,最多 8 张参考图、2K 分辨率和精准文字渲染,专为产品摄影和品牌视觉打造。

推荐理由

最高 2K 分辨率,照片级纹理细节

适合任务
产品图和电商主视觉图
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 5 积分起
图片内文字和 Logo 渲染精准最多 8 张参考图保持风格/角色一致性

OpenAI

GPT-5.5

对话

OpenAI 在 Rivya 上的高阶 GPT 对话模型,适合复杂推理、图像辅助分析、研究整合和结构化写作。

推荐理由

复杂推理和多步骤分析上限更高

适合任务
长资料包或杂乱材料的研究整合
输入
文本
输出
文本 / 推理
积分
按量付费 - 根据使用量消耗积分
支持视觉输入,最多 6 张图片适合结构化简报、研究整理和决策写作

OpenAI

GPT-5.4

对话

OpenAI 在 Rivya 上更高阶的 AI 对话模型,支持更完整的结构化输入、推理强度控制与工具型对话,适合复杂分析和多步骤任务。

推荐理由

复杂分析和多步骤规划能力更强

适合任务
长策略简报和决策备忘录
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
支持视觉输入,最多 6 张图片适合结构化任务与工具调用型对话

OpenAI

GPT-5.4 Codex

对话

OpenAI 在 Rivya 上更高阶的 Codex AI 编码模型,延续代码生成、结构化推理和工具协作能力,更适合仓库级开发项目。

推荐理由

更高规格的 Codex 推理与代码协作

适合任务
仓库级调试和架构审阅
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
继续支持 `Responses` 选项适合复杂代码、工具调用和多步骤任务

OpenAI

GPT-5.3 Codex

对话

OpenAI 在 Rivya 上更强的 Codex AI 编码模型,把更先进的代码生成和更深的 agentic reasoning 合在一起,适合最高要求的开发项目。

推荐理由

OpenAI 最强代码模型

适合任务
大型代码库里的疑难调试
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
最先进的代码生成质量最深度推理,解决复杂问题

OpenAI

GPT-5.2

对话

OpenAI 在 Rivya 上的旗舰 AI 对话模型,支持高级推理、最多 6 张图片的视觉理解和 20K 字符上下文,适合研究、规划、写作和带图分析。

推荐理由

高级推理和复杂分析

适合任务
策略备忘录和决策文档
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
视觉理解——分析最多 6 张图片20K 字符上下文窗口

OpenAI

GPT-5.2 Codex

对话

OpenAI 在 Rivya 上更进阶的 Codex AI 编码模型,复杂工程任务推理更强,更适合长链路 agentic coding、架构判断和更大规模的重构工作。

推荐理由

复杂工程推理更强

适合任务
架构评审和系统设计取舍
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
更适合系统设计和架构12K 输出 Token,全面代码生成

OpenAI

GPT-5.1 Codex

对话

OpenAI 在 Rivya 上升级版的 Codex AI 编码模型,代码准确性和推理更强,继续支持长输出和仓库级项目,更适合多文件重构与更稳的代码修改。

推荐理由

代码准确性优于 GPT-5 Codex

适合任务
多文件重构和迁移任务
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
更擅长多文件重构12K 输出 Token 上限,适合长代码生成

OpenAI

GPT-5 Codex

对话

OpenAI 在 Rivya 上的 GPT-5 Codex 代码专用模型,适合调试、实现规划、模块改造和面向真实代码库的技术问题求解,也支持视觉理解。

推荐理由

代码专用,12K 输出 Token 上限

适合任务
代码审查和缺陷修复
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
针对代码生成和调试优化视觉理解,分析截图/图表

Google

Gemini 3.1 Pro

对话

Google 在 Rivya 上最新最强的 Gemini AI 对话模型,具备顶级推理、视觉理解和指令遵循能力,更适合高要求分析和创意任务。

推荐理由

Google 最强 Gemini 模型

适合任务
长上下文研究材料整合
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
顶级推理和指令遵循视觉理解,最多 6 张图片

Google

Gemini 3 Pro

对话

Google 在 Rivya 上更高深度的 Gemini AI 对话模型,推理强于 Gemini 2.5 Pro,并支持视觉理解,更适合研究整理、技术写作和更审慎的多模态分析。

推荐理由

推理能力优于 Gemini 2.5 Pro

适合任务
长文分析和结构化建议
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
视觉理解,最多 6 张图片擅长研究综合和技术写作

Google

Gemini 3 Flash

对话

Google 在 Rivya 上新一代快速 AI 对话模型,Token 成本比 Gemini 2.5 Flash 更低、推理更强,更适合高频多模态对话、截图分流和大吞吐助手项目。

推荐理由

全部对话模型中最低的 Token 定价

适合任务
高频截图分析和快速分流
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
推理能力优于 Gemini 2.5 Flash视觉理解,最多 6 张图片

Google

Gemini 2.5 Pro

对话

Google 在 Rivya 上更进阶的 Gemini AI 对话模型,推理能力强于 Flash,并支持视觉理解和 20K 上下文,更适合研究整理、文档分析和结构化写作。

推荐理由

推理能力强于 Gemini Flash

适合任务
研究综合和分析写作
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
视觉理解——分析最多 6 张图片2 积分/次,成本均衡

Google

Gemini 2.5 Flash

对话

Google 在 Rivya 上速度最快、成本最低的 AI 对话模型,1 积分/次,支持最多 6 张图片的视觉理解,适合快速问答、一轮摘要、截图分流和日常 AI 辅助。

推荐理由

最低成本对话模型,仅 1 积分

适合任务
快速研究和一轮摘要
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
快速响应,适合实时对话视觉理解——分析最多 6 张图片

Anthropic

Claude Opus 4.7

对话

Anthropic 在 Rivya 上的旗舰 Claude 对话模型,适合深度推理、谨慎整合、管理层写作和高影响文本任务。

推荐理由

旗舰级文本推理和资料整合能力

适合任务
管理层备忘录和面向决策者的叙事写作
输入
文本
输出
文本 / 推理
积分
按量付费 - 根据使用量消耗积分
适合长文分析与谨慎写作当前 Rivya 前台以文本 Claude 项目为主

Anthropic

Claude Opus 4.6

对话

Anthropic 在 Rivya 上旗舰级的 Claude AI 对话模型,强调深度推理、复杂分析和高质量写作,适合关键任务和高要求场景。

推荐理由

旗舰级推理和复杂分析能力

适合任务
高层 备忘录 和高要求长文写作
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
长文理解与高质量输出上限更高当前 Rivya 前台以纯文本 Claude 项目为主

Anthropic

Claude Sonnet 4.6

对话

Anthropic 在 Rivya 上均衡型的 Claude AI 对话模型,延续长文理解和审慎分析能力,适合内容、研究和代码协作,又不用一开始就上 Opus 档位。

推荐理由

稳定推理和均衡质量

适合任务
审阅长简报、PRD 和策略文档
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
长文理解与多轮对话表现可靠当前 Rivya 前台以纯文本 Claude 项目为主

Anthropic

Claude Opus 4.5

对话

Anthropic 在 Rivya 上旗舰级的 Claude AI 对话模型,深度推理、复杂分析和专家级写作表现卓越,是关键任务的高端选择。

推荐理由

Anthropic 最强模型

适合任务
深度研究和复杂分析
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
卓越的深度推理和复杂分析专家级写作和内容质量

Anthropic

Claude Sonnet 4.5

对话

Anthropic 在 Rivya 上均衡型的 Claude AI 对话模型,擅长细腻写作、审慎分析和更克制的响应,适合内容创作和研究。

推荐理由

细腻写作和审慎分析

适合任务
编辑式改写和语气打磨
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
安全意识强,响应校准精准当前 Rivya 前台以纯文本 Claude 项目为主

Anthropic

Claude Haiku 4.5

对话

Anthropic 在 Rivya 上轻量型的 Claude AI 对话模型,强调速度、成本效率和稳定的日常对话表现,适合高频使用场景。

推荐理由

低延迟和高频使用更友好

适合任务
日常收件箱分流和内部问答
输入
文本
输出
文本 / 推理
积分
按量付费 — 根据使用量消耗积分
token 成本显著低于 Sonnet / Opus当前 Rivya 前台以纯文本 Claude 项目为主

Alibaba

Z-Image

图片

阿里巴巴轻量级文生图模型,支持 5 种宽高比,1 积分即可快速出图,适合概念草图和社交媒体素材。

推荐理由

全站最低成本,1 积分即可生成

适合任务
低成本初步视觉概念图
输入
文本
输出
图片
积分
每次生成约 1 积分起
单图快速输出,适合快速迭代纯文生图,支持 5 种宽高比预设

Google

Nano Banana 2

图片

Google 新一代图片模型,支持 4K 分辨率、15 种宽高比(含极端 8:1)、Google 搜索增强和最多 14 张参考图——Rivya 上最灵活的图片生成器。

推荐理由

最高 4K 分辨率(1K / 2K / 4K 可选)

适合任务
大画幅和极宽构图探索
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 5 积分起
15 种宽高比,含极端 8:1 和 1:8 全景Google 搜索增强,注入真实世界上下文

Google

Nano Banana Pro

图片

Google 高端图片模型,4K 输出、11 种宽高比、最多 8 张参考图,针对高保真品牌与营销视觉优化,细节和色彩精准度更高。

推荐理由

最高 4K 分辨率,保真度更高

适合任务
更高完成度的品牌主视觉
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 8 积分起
11 种宽高比,支持自动检测最多 8 张参考图保持品牌一致性

Google

Nano Banana

图片

Google 的灵活图片模型,支持文生图、图生图、11 种宽高比、最多 10 张参考图,以及 PNG/JPEG 输出,适合人像、产品构图和更宽画幅的营销视觉。

推荐理由

11 种宽高比,含超宽 21:9 和自动模式

适合任务
多参考图驱动的产品构图
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 3 积分起
最多 10 张参考图引导创作支持 PNG 和 JPEG 输出格式

OpenAI

GPT Image 2

图片

Rivya 当前接入的 OpenAI 新一代图片模型,支持文生图、图生图、最多 16 张参考图,以及 1K / 2K / 4K 三档清晰积分。

推荐理由

同一模型页覆盖文生图和图生图

适合任务
高分辨率商品图和广告视觉
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成 3 积分起
1K、2K、4K 三档分辨率,预算更直观最多 16 张参考图,适合结构化编辑 brief

OpenAI

GPT Image 1.5

图片

OpenAI 图片模型,支持标准/高清两档质量和最多 16 张参考图,擅长理解复杂指令并渲染空间关系准确的连贯场景。

推荐理由

最多 16 张参考图——Rivya 上最多

适合任务
指令很多的产品图和广告视觉
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 4 积分起
标准/高清两档质量,灵活控制成本基于 OpenAI 语言模型的卓越提示词理解

OpenAI

4o Image

图片

4o Image 是 Rivya 里的轻量 OpenAI 文生图入口,表单只保留提示词与 3 种常用比例,适合快速验证图片想法。

推荐理由

保留独立 OpenAI 图片生成入口

适合任务
从文字需求快速出第一版视觉方向
输入
文本
输出
图片
积分
每次生成约 3 积分起
轻量文生图路径,适合快速出草稿支持 1:1、3:2、2:3 三种常用比例

ByteDance

Seedream 5.0 Lite

图片

字节跳动更轻量的 Seedream 图片模型,在 Rivya 里对文生图和图像编辑统一按固定 6 积分计费。支持 8 种宽高比、最多 14 张参考图,适合作为 Seedream 家族里更低门槛的一档。

推荐理由

文生图和图生图统一固定 6 积分

适合任务
多参考图驱动的广告方向板和氛围探索
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 6 积分起
最多 14 张参考图,适合引导式编辑项目8 种宽高比,包含超宽 21:9

ByteDance

Seedream 4.5

图片

字节跳动高端图片模型,2K/4K 双档质量、8 种宽高比、最多 14 张参考图,以电影级调色和丰富纹理细节著称,擅长时尚和生活方式视觉。

推荐理由

2K(标准)和 4K(高清)双档质量可选

适合任务
时尚和生活方式广告视觉
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 7 积分起
最多 14 张参考图引导创作8 种宽高比,含超宽 21:9

ByteDance

Seedream 4.0

图片

Seedream 4.0 是 Rivya 里的均衡 ByteDance 图片模型,适合文生图、参考图编辑和明确输出规格的图片项目。

推荐理由

一个模型入口统一承接文生图和图片编辑

适合任务
生活方式视觉和编辑感图片草稿
输入
文本 / 参考素材 / 图片
输出
图片
积分
固定 6 积分 / 次
保留公开文档里的 `image_resolution` 与 `max_images` 控制项最多支持 10 张参考图进入编辑路径

ByteDance

Seedream 3.0

图片

Seedream 3.0 是 Rivya 里的旧线 Seedream 文生图入口,适合轻量中文图片草稿、双语提示词测试和旧版视觉方向对照。

推荐理由

保留旧线 Seedream 文生图入口

适合任务
需要保留旧版 Seedream 视觉气质的团队
输入
文本
输出
图片
积分
固定 5 积分 / 次
参数更少,适合轻量试用参数面比新版本更轻,适合快速试用

xAI

Grok Imagine

图片

xAI 图片模型,创意解读能力强,5 种宽高比,单图生成专注于艺术表达和非常规视觉风格。

推荐理由

创意和艺术解读能力强

适合任务
大胆概念图和实验性视觉方向
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 4 积分起
独特视觉风格,区别于其他模型支持文生图和图生图

Black Forest Labs

Flux 2 Pro

图片

Black Forest Labs 旗舰 320 亿参数模型,支持文生图和图生图,最多 8 张参考图、2K 分辨率和精准文字渲染,专为产品摄影和品牌视觉打造。

推荐理由

最高 2K 分辨率,照片级纹理细节

适合任务
产品图和电商主视觉图
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 5 积分起
图片内文字和 Logo 渲染精准最多 8 张参考图保持风格/角色一致性

Black Forest Labs

Flux 2 Flex

图片

Flux 2 系列的编辑专用变体,专注结构调整和风格迁移,最多 8 张参考图、2K 分辨率——适合在现有视觉基础上迭代优化。

推荐理由

针对图片编辑和风格迁移优化

适合任务
对已有广告图或产品图继续改图
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 14 积分起
最多 8 张参考图引导编辑2K 分辨率输出,Flux 2 品质

Black Forest Labs

Flux Kontext Max

图片

Black Forest Labs 的 Flux Kontext 增强模型,面向更复杂的提示词生成和图片编辑任务。当前在 Rivya 里,文生图与图生图继续共用同一条异步项目,并统一按固定 8 积分/次执行平台定价。

推荐理由

文生图和图像编辑当前统一固定 8 积分

适合任务
关键广告主视觉的深一层精修
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 8 积分起
在保持 Kontext 项目形态不变的前提下提供更高档位同一模型内同时支持文本生成与单图编辑

Black Forest Labs

Flux Kontext Pro

图片

Black Forest Labs 的低门槛 Flux Kontext 选项,当前在 Rivya 上同时承接文生图、图生图和单图改图。按当前平台定价口径,这几个模式都统一按固定 4 积分结算,并继续沿现有异步图片结果链收口。

推荐理由

文生图和图像编辑当前统一固定 4 积分

适合任务
基于 1 张已定稿素材继续做广告或社媒变体
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 4 积分起
同一模型内同时支持文本生成与单图编辑内置自动翻译开关,用来承接英文提示词要求

Alibaba

Qwen2 Image

图片

阿里 Qwen2 图片模型当前在 Rivya 里按一个固定积分图片项目接入。它安全覆盖文生图与图生图两种模式,只开放两份公开文档共同出现的宽高比子集,并保留 PNG/JPEG 输出、随机种子与简单内容过滤开关。

推荐理由

文生图和图生图统一固定 6 积分

适合任务
中文提示词驱动的海报和广告视觉
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 6 积分起
文生走 `qwen2/text-to-image`,带参考图时切到 `qwen2/image-edit`只开放两份公开 Qwen2 文档共同覆盖的安全宽高比集合

Alibaba

Qwen Image

图片

阿里巴巴通义千问系列图片模型,提供高清预设尺寸(方形、竖向、横向)和 PNG/JPEG 输出,擅长中文提示词和文化细节的视觉生成。

推荐理由

高清预设尺寸:方形、竖向 4:3/16:9、横向 4:3/16:9

适合任务
中文语境下的营销视觉
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 4 积分起
中文提示词理解能力强支持 PNG 和 JPEG 输出格式

Midjourney

Midjourney

图片

Midjourney 的 V7 图片模型,支持文生图、图生图、Niji 动漫模式、风格参考和 Omni Reference 一致性控制,仍然是电影感艺术图、插画和风格板的行业标杆。

推荐理由

无与伦比的美学品质——行业标杆

适合任务
电影感概念图和风格板
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 3 积分起
V7 + V6.1 + V6 + Niji 7/6 动漫模式3 档速度:Relaxed、Fast、Turbo

Recraft

Recraft Remove Background

图片

Recraft 在 Rivya 上的去背景模型,适合从一张现有图片里把主体干净分离出来。它更适合透明 cutout、主体分离和下一步设计前的干净源图。

推荐理由

单用途 cutout 工具,当前固定 1 积分

适合任务
在设计前先把单张商品图、人像或目录图的背景去掉
输入
参考素材 / 图片
输出
图片
积分
每次生成约 1 积分起
只围绕 1 张上传图片工作,而且通常不需要提示词更适合主体边缘清楚的商品图、人像和透明主体素材

Recraft

Recraft Crisp Upscale

图片

Recraft 在 Rivya 上的轻量图片放大模型,适合对一张已经选定的图片做低成本锐化和清晰度补强,而不是直接上更重的交付级放大。

推荐理由

单张图片 1 积分的低成本提清步骤

适合任务
给缩略图、社媒图或偏小的商品图补一轮快速提清
输入
参考素材 / 图片
输出
图片
积分
每次生成约 1 积分起
适合发布前、交付前做轻量提清和微放大没有必须管理的尺寸档位,也不要求提示词,所以很适合做低摩擦预检

Alibaba

Wan 2.7 Image Pro

图片

阿里更高阶的 Wan 2.7 图片模型,当前在 Rivya 里作为独立图片模型入口接入文生图与图像编辑,当前每次生成消耗 12 积分。

推荐理由

文生图和图生图统一固定 12 积分

适合任务
品牌主视觉和发布广告静帧
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 12 积分起
最多 9 张参考图,适合引导式编辑项目Wan 2.7 图片家族里更高阶的一档独立入口

Alibaba

Wan 2.7 Image

图片

阿里标准档的 Wan 2.7 图片模型,当前在 Rivya 里作为独立图片模型入口接入文生图与图像编辑,当前每次生成消耗 5 积分。

推荐理由

当前每次生成消耗 5 积分

适合任务
多参考图驱动的社媒和广告草图
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 5 积分起
同时支持文生图和图生图最多 9 张参考图,适合引导式编辑

Google

Google Imagen4 Ultra

图片

Google Imagen4 Ultra 是 Rivya 上更高档的一档 Imagen 文生图模型。当前按固定 12 积分、单张输出项目接入,并开放公开文档里可稳定承接的提示词、反向提示词、宽高比和种子参数。

推荐理由

当前固定 12 积分

适合任务
首页主视觉图和高规格广告视觉
输入
文本
输出
图片
积分
每次生成约 12 积分起
更高档的 Google Imagen 文生图入口支持反向提示词、宽高比和种子参数

Google

Google Imagen4

图片

Google Imagen4 是 Rivya 上标准档的 Imagen 文生图模型。当前按固定 8 积分、单张输出项目接入,并开放公开文档里可稳定承接的提示词、反向提示词、宽高比和种子参数。

推荐理由

当前固定 8 积分

适合任务
网站主视觉图和杂志感插画
输入
文本
输出
图片
积分
每次生成约 8 积分起
标准档 Google Imagen 文生图入口支持反向提示词、宽高比和种子参数

Google

Google Imagen4 Fast

图片

Google Imagen4 Fast 是 Rivya 上更轻量的一档 Google Imagen 文生图模型。当前继续按单张输出项目接入,固定 4 积分,并开放公开文档中可稳定承接的提示词、反向提示词、宽高比和种子参数。

推荐理由

当前固定 4 积分

适合任务
落地页和博客封面的初步方向图
输入
文本
输出
图片
积分
每次生成约 4 积分起
更轻量的 Google Imagen 文生图入口支持反向提示词、宽高比和随机种子

Topaz

Topaz Image Upscaler

图片

Topaz 在 Rivya 上的交付级图片放大模型,适合构图已经定了,只剩导出尺寸、评审分辨率或印刷清晰度还不够的静帧。

推荐理由

面向已确认静帧的交付级放大,而不是重生成构图

适合任务
把已经确认的电商图、产品图或广告静帧放大到更适合交付的尺寸
输入
参考素材 / 图片
输出
图片
积分
每次处理约 5 积分起
基于 factor 1、2、4、8 的前台档位,让尺寸和成本取舍更容易判断当静帧已经定稿、目标尺寸本身真的重要时,比 Recraft Crisp Upscale 更合适

Ideogram

Ideogram V3

图片

Ideogram V3 是 Rivya 里偏文字渲染、海报版式和设计导向的文生图模型。当前价格为:TURBO 4 积分,BALANCED 7 积分,QUALITY 10 积分。

推荐理由

渲染速度分档:TURBO、BALANCED、QUALITY

适合任务
海报概念和标题导向的广告图
输入
文本
输出
图片
积分
每次生成约 4 积分起
偏设计导向的 Ideogram V3 文生图能力支持 MagicPrompt 扩展开关

Ideogram

Ideogram V3 Reframe

图片

Ideogram V3 Reframe 当前在 Rivya 上按渲染速度分档接入单图重构项目。当前价格为:TURBO 4 积分,BALANCED 7 积分,QUALITY 10 积分。

推荐理由

渲染速度分档:TURBO、BALANCED、QUALITY

适合任务
把一张已定稿视觉改成新比例
输入
参考素材 / 图片
输出
图片
积分
每次生成约 4 积分起
单图重构项目当前模型允许空 prompt

Ideogram

Ideogram V3 Remix

图片

Ideogram V3 Remix 当前在 Rivya 上按渲染速度分档接入单图重混项目。当前价格为:TURBO 4 积分,BALANCED 7 积分,QUALITY 10 积分。

推荐理由

渲染速度分档:TURBO、BALANCED、QUALITY

适合任务
围绕 1 张源图尝试不同视觉方向
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 4 积分起
单图重混项目支持 MagicPrompt、strength 和反向提示词

Ideogram

Ideogram Character

图片

面向角色一致性的专门入口,把 1 张已经定下来的角色图延展到新场景、新服装和新尺寸。适合你更在意身份保留,而不是开放式图片编辑,并且一次只需要 1 张输出图。

推荐理由

围绕单角色参考图工作,重点是跨场景保持同一角色可辨认

适合任务
让同一个吉祥物、头像角色或插画人物在很多新场景里都保持可辨认
输入
文本 / 参考素材 / 图片
输出
图片
积分
每次生成约 12 积分起
和 Ideogram V3 / Reframe / Remix 明确分开,方便用户优先选择一致性而不是泛编辑单图输出,配合 TURBO / BALANCED / QUALITY 三档积分更容易预估成本

ByteDance

Seedance 2.0

视频

字节跳动完整版 Seedance 2.0 视频模型,当前在 Rivya 里完整接入了文生视频、首帧/首尾帧驱动,以及多模态参考生视频三类场景。产品层保留了与文档一致的角色拆分,避免把首尾帧和参考图/参考视频/参考音频混成一个模糊上传桶。

推荐理由

完整覆盖文生、首尾帧、多模态参考三类场景

适合任务
从提示词、首尾帧或参考包生成更高质量短片
输入
文本
输出
视频
积分
每次生成约 64 积分起
一个模型入口容纳提示词、首尾帧和多模态参考项目480p / 720p 输出与 adaptive 宽高比支持

ByteDance

Seedance 2.0 Fast

视频

字节跳动更快的 Seedance 2.0 视频模型,当前在 Rivya 里完整接入了文生视频、首帧/首尾帧驱动,以及多模态参考生视频三类场景。为了避免首尾帧和参考图/参考视频/参考音频的角色混淆,产品层保持了与文档一致的显式场景拆分。

推荐理由

完整覆盖文生、首尾帧、多模态参考三类场景

适合任务
从提示词或分镜帧快速做广告预演
输入
文本
输出
视频
积分
每次生成约 52 积分起
480p / 720p 输出与 adaptive 宽高比支持可选同步音频生成和返回最后一帧

ByteDance

Seedance 1.5 Pro

视频

字节跳动的旗舰视频模型,支持文生视频、图生视频、原生音视频同步、480p–1080p、4–12 秒片段、6 种宽高比、动态/固定镜头控制,以及唇形同步。

推荐理由

原生音视频同步,唇形精准匹配

适合任务
需要音视频同步的短片
输入
文本 / 参考素材 / 图片
输出
视频
积分
每次生成约 28 积分起
480p / 720p / 1080p 分辨率可选4 秒、8 秒、12 秒可配置片段时长

ByteDance

Seedance 1.0 Pro

视频

字节跳动 Seedance 1.0 Pro 模型,当前在 Rivya 里作为 Seedance 1.0 标准 Pro 路径接入文生视频和图生视频。产品面保持与公开 V1 Pro 文档对齐,开放分辨率、时长、锁定镜头、随机种子和安全检查参数。

推荐理由

同时支持文生视频和图生视频

适合任务
短视频电影感生成
输入
文本 / 参考素材 / 图片
输出
视频
积分
每次生成约 25 积分起
480p、720p、1080p 三档分辨率5 秒和 10 秒时长控制

ByteDance

Seedance 1.0 Pro Fast

视频

字节跳动快速图生视频模型,将单张参考图动画化为 5 秒或 10 秒片段(720p/1080p)——需要从静态图快速出视频时的最优选择。

推荐理由

图生视频专精——快速出片

适合任务
从单张图片快速起动态
输入
文本 / 参考素材 / 图片
输出
视频
积分
16-72 积分 / 次
720p 和 1080p 分辨率可选5 秒或 10 秒片段时长

ByteDance

Seedance 1.0 Lite

视频

字节跳动 Seedance 1.0 Lite 模型,当前在 Rivya 里作为更轻量的 1.0 路径接入文生视频和图生视频。参数面继续对齐公开 V1 Lite 文档,当前价格也保持在比 Seedance 1.0 Pro 更低的一档。

推荐理由

同时支持文生视频和图生视频

适合任务
更低成本的分镜测试
输入
文本 / 参考素材 / 图片
输出
视频
积分
每次生成约 16 积分起
当前价格低于 Seedance 1.0 Pro图生视频支持第 2 张图作为可选尾帧

HappyHorse

HappyHorse 1.0

视频

Rivya 上灵活的视频模型,一个公开模型页同时支持文生视频、单图图生视频、多图参考视频和视频编辑。

推荐理由

一个模型页覆盖文本、图片、参考图和视频编辑工作流

适合任务
从文字简报生成广告或产品动态草案
输入
文本 / 参考素材 / 图片 / 视频
输出
视频
积分
每次生成约 28 积分起
支持 720p 和 1080p 两档固定价格无视频时最多支持 9 张图片参考

Alibaba

Wan 2.7 Video

视频

阿里更新一代 Wan 视频模型,当前在 Rivya 里按分辨率和时长计费。产品层目前统一开放文生视频、图生视频和视频编辑,5 秒 720p 从 80 积分起。

推荐理由

按分辨率和时长计费:720p = 16 积分/秒,1080p = 24 积分/秒

适合任务
短片产品宣传片和社媒短切版
输入
文本 / 参考素材 / 图片 / 视频
输出
视频
积分
每次生成 80 积分起
一个模型入口覆盖文生视频、图生视频和视频编辑图生视频支持单图或首尾帧双图

Alibaba

Wan 2.6

视频

阿里 Wan 家族在 Rivya 上的三模式重项目:文生视频、图生视频和源视频改写都放在同一条选项上。当前支持 720p / 1080p、5–15 秒,并且一次只承接 1 张图片或 1 段源视频。

推荐理由

三模式:文生视频 + 图生视频 + 视频生视频

适合任务
从现有源视频继续做 video-to-video 编辑
输入
文本 / 参考素材 / 图片 / 视频
输出
视频
积分
每次生成约 70 积分起
一条更重的 Wan 选项,同时支持从现有源视频起步,而不只是文本或静帧一次只用 1 张图片或 1 段源视频,编辑路径更清楚

Alibaba

Wan 2.5 Video

视频

Wan 2.5 当前在 Rivya 上统一承接文生视频与图生视频,当前价格为:`720p_5 = 60`、`720p_10 = 120`、`1080p_5 = 100`、`1080p_10 = 200`。

推荐理由

一个模型入口统一承接文生视频与图生视频

适合任务
用文本或 1 张主视觉生成 5 秒 / 10 秒 Wan 宣传短片
输入
文本 / 参考素材 / 图片
输出
视频
积分
每次生成 60 积分起
当前按 4 档清晰价格执行继续沿用现有异步视频结果链,不新增结果类型

Alibaba

Wan 2.2 A14B Turbo

视频

Wan 2.2 A14B Turbo 当前在 Rivya 上统一承接文生视频、图生视频,以及需要 1 张图片加 1 段音频的语音驱动视频。当前价格为:文生/图生 `480p = 8`、`720p = 12`;图片+音频驱动 `480p = 16`、`580p = 20`、`720p = 24`。

推荐理由

一个模型入口统一承接文生、图生和图片+音频驱动视频

适合任务
较轻量的 Wan 文生视频尝试
输入
文本 / 参考素材 / 图片 / 音频
输出
视频
积分
8 积分 / 次起
文生/图生与图片+音频驱动视频分别按当前价格分层执行图片+音频驱动视频保留了自己独立的一组高级参数子集

Alibaba

Wan 动画替换

视频

Wan 在 Rivya 上的角色替换视频模型,适合把已有视频里出现的人物或主体换掉。它适合动作已经对了,只需要 1 条公开源视频 URL、1 条公开替换图 URL 和分辨率档位的情况。

推荐理由

保持公开接口的 `video_url + image_url + resolution` 形状,不额外造出 prompt 型项目

适合任务
在保留源视频动作的前提下替换画面中的人物或主体
输入
视频
输出
视频
积分
12 积分 / 次起
更适合做主体或角色替换,而不是重新生成整条视频当源视频和替换图片都已经放在公开存储上时,项目最顺手

MiniMax

Hailuo 2.3

视频

MiniMax 的图生视频模型,支持 Standard/Pro 双档质量、768P/1080P 分辨率、6 秒或 10 秒片段,以更顺滑的运动和自然过渡著称。

推荐理由

Standard 和 Pro 双档质量

适合任务
把人像或时尚静帧转成动态片段
输入
文本 / 参考素材 / 图片
输出
视频
积分
每次生成约 25 积分起
768P 和 1080P 分辨率可选6 秒或 10 秒可配置片段时长

MiniMax

Hailuo Pro

视频

MiniMax 旧版 Hailuo Pro 视频模型,当前按固定 Pro 档位接入,统一支持文生视频和图生视频。图生侧可上传 1 到 2 张参考图,第二张会作为尾帧图参与生成,当前每次生成消耗 57 积分。

推荐理由

同一模型支持文生视频和图生视频

适合任务
从 1 张关键视觉做更高质量的动态草稿
输入
文本 / 参考素材 / 图片
输出
视频
积分
57 积分 / 次
图生侧支持首图或首尾帧双图当前按公开可确认的 Pro 固定档位接入

MiniMax

Hailuo Standard

视频

MiniMax 旧线 Hailuo Standard 视频模型,支持文生视频和图生视频。图生侧可上传 1 到 2 张参考图,第二张会作为尾帧图参与生成。

推荐理由

同一模型支持文生视频和图生视频

适合任务
把 1 张主视觉快速变成短预告片
输入
文本 / 参考素材 / 图片
输出
视频
积分
12-50 积分 / 次
图生侧支持首图或首尾帧双图512P 与 768P 图生档位可选

Kuaishou

Kling 3.0

视频

快手的高端视频模型,支持文生视频、图生视频、Standard (720P) / Pro (1080P) 双档、单/多镜头结构、3–15 秒时长、可选音频,以及最多 2 张参考图。

推荐理由

Standard (720P) 和 Pro (1080P) 双档质量

适合任务
需要明确镜头结构的广告预演和分镜稿
输入
文本 / 参考素材 / 图片
输出
视频
积分
每次生成约 42 积分起
单镜头或多镜头生成模式灵活的 3–15 秒片段时长

Kuaishou

Kling 3.0 motion-control

视频

更新一代的 Kling 动作控制项目,用 1 张参考图加 1 段动作视频驱动同一主体,并多了背景来源选择。适合你不仅要做动作迁移,还要决定最终场景更像视频环境还是参考图世界。

推荐理由

严格的 1 图 + 1 动作视频项目,身份和动作来源划分很清楚

适合任务
需要明确决定背景来自动作视频还是参考图片的动作迁移任务
输入
文本 / 参考素材 / 图片 / 视频
输出
视频
积分
每次生成约 20 积分起
相比 Kling 2.6 motion-control,多了 `background_source` 这个真正关键的升级点Standard (720P) / Pro (1080P) 价格固定为 20 / 27 积分

Kuaishou

Kling 2.6

视频

快手视频模型,可选音频生成、5/10 秒片段、3 种宽高比,擅长人物运动和表情丰富的角色动画,物理效果自然。

推荐理由

可选音频与视频同步生成

适合任务
人物表现和更有表情的运动镜头
输入
文本 / 参考素材 / 图片
输出
视频
积分
每次生成约 55 积分起
5 秒或 10 秒片段时长3 种宽高比:1:1、16:9、9:16

Kuaishou

Kling 2.6 motion-control

视频

更偏轻量和低成本的 Kling 动作迁移项目,用 1 张参考图加 1 段动作视频驱动同一主体。适合想先做便宜一档的 motion-control 测试,又不需要 Kling 3.0 那组额外场景控制时使用。

推荐理由

严格的 1 图 + 1 动作视频项目,角色身份和动作来源非常清楚

适合任务
用 1 张静态角色图加 1 段动作参考视频驱动同一主体
输入
文本 / 参考素材 / 图片 / 视频
输出
视频
积分
每次生成约 16 积分起
相较 Kling 3.0 motion-control 更便宜,当前只要 16 / 22 积分提示词可选,方便让上传的动作视频继续做主要驱动

Kuaishou

Kling V2.5 Turbo Pro

视频

快手可灵 V2.5 Turbo Pro 视频模型,当前同时支持文生和图生。当前价格为:5 秒 42 积分,10 秒 84 积分。

推荐理由

公开文生和图生价格档位都明确

适合任务
从文本或首尾帧起步的短广告预演
输入
文本 / 参考素材 / 图片
输出
视频
积分
42-84 积分 / 次
文生与图生都纳入同一独立模型图生支持首图和可选尾帧图

Kuaishou

Kling V2.1 Master

视频

快手可灵旧版 V2.1 Master 视频模型,当前同时支持文生和图生。当前价格为:5 秒 160 积分,10 秒 320 积分。

推荐理由

5 秒与 10 秒都提供固定价格档位

适合任务
旧版 Kling Master 和新档位的对照测试
输入
文本 / 参考素材 / 图片
输出
视频
积分
160-320 积分 / 次
文生与图生都已纳入同一独立模型文生支持 `aspect_ratio`,图生继续只暴露公开字段

Kuaishou

Kling V2.1 Pro

视频

快手可灵旧版 V2.1 Pro 图生视频模型,支持首图与可选尾帧双图。当前价格为:5 秒 50 积分,10 秒 100 积分。

推荐理由

只保留图生视频,路径更收敛

适合任务
已有首尾帧的过渡镜头测试
输入
文本 / 参考素材 / 图片
输出
视频
积分
50-100 积分 / 次
支持首图和可选尾帧双图5 秒与 10 秒都提供固定价格档位

Kuaishou

Kling V2.1 Standard

视频

快手可灵旧版 V2.1 Standard 图生视频模型,当前价格为:5 秒 25 积分,10 秒 50 积分。

推荐理由

只保留图生视频路径

适合任务
把 1 张产品图快速变成 动态草稿
输入
文本 / 参考素材 / 图片
输出
视频
积分
25-50 积分 / 次
5 秒与 10 秒都提供固定价格档位支持 `negative_prompt` 与 `cfg_scale`

Kuaishou

Kling AI Avatar Pro

视频

快手可灵 AI Avatar Pro 高质量数字人口播模型,固定使用 1 张人物图和 1 段音频生成口型同步视频。Rivya 当前按固定 16 积分 / 次接入。

推荐理由

固定图片 + 音频驱动的高质量数字人口播流程

适合任务
高质量数字人口播视频
输入
文本 / 参考素材 / 图片 / 音频
输出
视频
积分
16 积分 / 次
当前固定 16 积分更适合质量优先的口型同步视频

Kuaishou

Kling AI Avatar Standard

视频

快手可灵 AI Avatar Standard 数字人口播模型,固定使用 1 张人物图和 1 段音频生成口型同步视频。Rivya 当前按固定 8 积分 / 次接入。

推荐理由

固定图片 + 音频驱动的数字人口播流程

适合任务
数字人口播视频
输入
文本 / 参考素材 / 图片 / 音频
输出
视频
积分
8 积分 / 次
当前固定 8 积分口型同步路径清晰

MeiGen-AI

Infinitalk

视频

Infinitalk 是一个基于图片和音频生成数字人口播视频的模型。当前价格按分辨率和音频时长计算:480p = 3 积分 / 秒,720p = 12 积分 / 秒。

推荐理由

固定图片 + 音频驱动的视频生成流程

适合任务
数字人口播
输入
文本 / 参考素材 / 图片 / 音频
输出
视频
积分
3 或 12 积分 / 秒
按分辨率和音频时长计算积分支持 480p / 720p 两档分辨率

Runway

Runway

视频

Runway 是一个支持文生视频和图生视频的独立视频模型。当前公开价格只明确覆盖 6 个生成档位,因此 Rivya 先按可确认的 `720p_5 = 12`、`720p_10 = 30`、`1080p_5 = 30` 接入。

推荐理由

公开文生和图生价格档位都明确

适合任务
5 秒品牌预告短片和社媒广告草稿
输入
文本 / 参考素材 / 图片
输出
视频
积分
12-30 积分 / 次
文生与图生共用同一独立模型文生支持 `aspectRatio`,图生自动沿用图片宽高比

Runway

Runway Aleph

视频

面向已有源视频的视频改写项目。适合运动和镜头基础来自你的输入素材,而视觉方向由提示词决定,当前固定 90 积分。

推荐理由

围绕 1 段源视频工作,动作基础来自你的素材而不是空白生成

适合任务
把已经通过的源视频改成另一种视觉方向或氛围
输入
文本 / 参考素材 / 视频 / 图片
输出
视频
积分
90 积分 / 次
提示词驱动改写,可选再加 1 张参考图辅助风格或主体方向和普通 Runway 5 秒 / 10 秒文生图生路径明确分开

Luma

Luma Modify Video

视频

独立的 source-video 改写入口,用来把一条现有视频推向新的视觉方向。适合你要的是 prompt 驱动改写,而不是单纯提高清晰度。

推荐理由

专门做 source-video 改写,不是单纯 enhancement

适合任务
把一条已确认的源视频改成另一种氛围、风格或 视觉方向
输入
参考素材 / 视频
输出
视频
积分
30 积分 / 次
更适合短视频、单一改写目标,以及 1 条以英文为主的提示词当你想改画面气质、氛围或 视觉方向 时,比 upscale 更合适

xAI

Grok Imagine Video

视频

xAI 视频模型,Fun/Normal/Spicy 三种创意模式和 5 种宽高比,独特风格预设覆盖从趣味到电影到前卫的不同创意调性。

推荐理由

独特的 Fun / Normal / Spicy 创意模式

适合任务
风格化预告短片和社媒短片
输入
文本 / 参考素材 / 图片
输出
视频
积分
每次生成约 10 积分起
支持 480p / 720p 两档分辨率并按秒计费支持 6 到 30 秒时长

OpenAI

Sora 2 Pro

视频

Sora 2 高端版,Standard/High 双档质量、10/15 秒片段、水印移除,细节、光影和运动保真度更高,适合专业视频制作。

推荐理由

Standard 和 High 双档质量,适合制作级使用

适合任务
高端产品短片和发布视频
输入
文本 / 参考素材 / 图片
输出
视频
积分
每次生成约 75 积分起
细节、光影和运动保真度更高10 秒或 15 秒片段,支持 10K 字符提示词

OpenAI

Sora 2

视频

OpenAI 的视频模型,支持文生视频、图生视频、同步音频、真实物理模拟、10/15 秒片段、横向/竖向输出,以及可选水印移除。

推荐理由

物理精准的世界模拟

适合任务
产品发布和品牌短片的电影感 预告短片
输入
文本 / 参考素材 / 图片
输出
视频
积分
每次生成约 6 积分起
10 秒或 15 秒片段,支持 10K 字符长提示词横向和竖向方向可选

OpenAI

Sora Watermark Remover

视频

Rivya 上面向公开 Sora 分享链接的去水印后处理模型。它适合 Sora 视频已经生成完成,剩下只是去水印,并顺手决定结果走 S3 还是 OSS。

推荐理由

专门面向公开 `sora.chatgpt.com` 分享链接,不是泛用视频上传工具

适合任务
在交付前移除公开 Sora 分享链接上的水印
输入
视频
输出
视频
积分
每次固定 3 积分
把去水印和 Sora 2 / Sora 2 Pro 生成明确分开在 Rivya 上只有两个关键输入:公开视频链接和输出存储位置

Topaz

Topaz Video Upscaler

视频

Topaz 在 Rivya 上的交付级视频放大模型,适合镜头、动作和节奏都已经定了,只剩导出分辨率和最终清晰度还不够的成片。

推荐理由

更适合已经确认内容不变,只差导出清晰度的成片

适合任务
在客户交付、演示或正式发布前,把已确认视频再提清一轮
输入
参考素材 / 视频
输出
视频
积分
12 积分 / 次
单视频、无提示词的流程,更像后期提清步骤,而不是重做镜头1x、2x、4x 三档简单清楚,而且当前都落在固定 12 积分档

Google

Veo3.1 Quality

视频

Google Veo 3.1 品质优先版,适合高规格的文生视频与图片驱动生成。更高保真的画面、更稳的运动真实感,以及默认带背景音频,使它成为 Rivya 上更高阶的 Veo 选项。

推荐理由

Rivya 上更高阶的 Veo 输出路径

适合任务
主发布影片和高端品牌片
输入
文本 / 参考素材 / 图片
输出
视频
积分
每次生成约 150 积分起
更适合主视觉影片和品牌成片默认带背景音频

Google

Veo3.1 Fast

视频

Google Veo 3.1 快速版,三模式支持:文生视频、图生视频、参考图生视频。最多 3 张参考图、原生音频,以及按模式区分的宽高比控制,适合快速试用电影感片段。

推荐理由

三模式:文字 / 图片 / 参考图生视频

适合任务
带原生音频的广告概念短片
输入
文本 / 参考素材 / 图片
输出
视频
积分
每次生成约 20 积分起
最多 3 张参考图引导生成原生音频与视频同步生成

Google

Veo3.1 Lite

视频

Google Veo 3.1 的最低成本档。Rivya 当前只开放最小稳定子集:文生视频和图生视频,固定 `10` 积分 / 次。

推荐理由

文生视频和图生视频在 Rivya 上都固定为 10 积分

适合任务
先低成本验证 Veo 方向,再进入升级
输入
文本 / 参考素材 / 图片
输出
视频
积分
10 积分 / 次
以当前最低成本承接 Veo 3.1 基础生成链路同时支持纯提示词和图片驱动生成

Suno

Suno Music

音频

Suno Music 是 Rivya 里的文本生成音乐模型,适合把一句简短需求直接变成有人声或纯音乐的歌曲草稿。它保持固定 `12` 积分入口,并在成功结果后继续提供 `Extend Music`。

推荐理由

公开定价固定为 12 积分 / 次

适合任务
验证一首歌的风格方向,再进入继续做长
输入
文本
输出
音频
积分
12 积分 / 次
首版只做最小生成子集,避免一次接入整族能力成功结果可继续发起 Extend Music 动作

Suno

Suno Sounds

音频

Suno Sounds 是 Rivya 里的轻量文本生成声音模型,适合做环境循环、背景音和短声音草稿。它保持公开定价固定 `3` 积分 / 次,并支持从成功结果继续做 `Vocal Separation`。

推荐理由

公开定价固定为 3 积分 / 次

适合任务
快速生成环境音、loop 和氛围底声
输入
文本
输出
音频
积分
3 积分 / 次
首版只开放循环、BPM 和 Key 这组最低风险参数继续沿现有 Suno 音频结果链返回普通音频 URL

Suno

Suno Lyrics

音频

Suno Lyrics 是 Rivya 里的歌词生成模型,适合把一个主题、情绪或故事线直接变成歌曲文本,每次生成消耗 `1` 积分。

推荐理由

当前每次生成消耗 1 积分

适合任务
在做歌曲前先把歌词草稿写顺
输入
文本
输出
音频
积分
1 积分 / 次
只开放最低风险的 prompt 单参数子集沿用现有异步任务流,同时允许没有媒体 URL 也能成功

ElevenLabs

ElevenLabs Dialogue V3

音频

ElevenLabs 在 Rivya 上的多角色对白模型,适合生成带有说话人切换节奏的对话音频,用于播客、访谈和角色对白。

推荐理由

多角色对白生成

适合任务
双主持播客开场和对谈片段
输入
文本
输出
音频
积分
根据时长或长度消耗积分
每个角色独立语音分配可调节稳定性保持一致表达

ElevenLabs

ElevenLabs Turbo 2.5

音频

ElevenLabs 在 Rivya 上的快速文本转语音模型,低延迟语音生成并支持稳定性、相似度、风格和速度调节,适合快节奏配音和口播试稿。

推荐理由

最快的 ElevenLabs TTS——低延迟优化

适合任务
产品演示、App walkthrough 和广告配音
输入
文本
输出
音频
积分
根据时长或长度消耗积分
可调节稳定性、相似度、风格和速度多种语音预设,上下文感知生成

ElevenLabs

ElevenLabs Multilingual V2

音频

ElevenLabs 在 Rivya 上的多语言文本转语音模型,支持约 30 种语言自动检测,更适合全球内容本地化和跨语言配音。

推荐理由

自动检测并生成约 30 种语言

适合任务
多语言产品演示和 onboarding 视频旁白
输入
文本
输出
音频
积分
根据时长或长度消耗积分
拟人化语调和音调细腻变化同样的语音控制:稳定性、相似度、风格、速度

ElevenLabs

ElevenLabs Sound Effect V2

音频

ElevenLabs 在 Rivya 上的文本生成音效模型,适合做短音效、转场声和可循环环境底音。你可以生成 0.5–22 秒音频片段,并控制提示词影响强度、循环模式和 19 种输出格式。

推荐理由

0.5–22 秒可配置音频时长

适合任务
按钮音、通知音和交互反馈声
输入
文本
输出
音频
积分
根据时长或长度消耗积分
可调提示词影响强度循环模式生成无缝重复音频

ElevenLabs

ElevenLabs Audio Isolation

音频

ElevenLabs 在 Rivya 上的音频清理与人声分离模型,上传现有录音即可做人声分离、降噪和 spoken audio 清理。

推荐理由

上传即用的音频分离——无需提示词

适合任务
剪辑前清理采访和播客录音
输入
参考素材 / 音频
输出
音频
积分
根据时长或长度消耗积分
人声分离和背景噪音去除按音频时长计费

已经挑出几款想试的模型了?

先在这里完成筛选,再进 Rivya 里实际试跑,不用在不同工具、钱包和历史记录之间来回切换。
新用户送 6 积分
几秒完成注册