AI 模型目录

先比较图片、视频、音频和对话模型，再决定消耗积分

按任务、输入、输出、提供方和积分提示浏览 95+ 个 AI 模型。先看每个模型适合什么、真实示例像什么，再把候选带进 Rivya 试跑。

新用户送 6 积分

几秒完成注册

图片视频音频对话

模型目录

按任务、输入和输出查找模型

按模态、输入类型、提供方、优势和积分提示缩小范围。进入模型页后，可以查看真实输出、任务适配度和在线试用入口。

4 类模型

全部模型

可以按模型、厂商、能力或任务搜索，再用事实筛选缩小范围，不必逐个打开详情页。

95 个模型候选

先比较输入、输出、积分和示例提示，再决定真正要带进候选清单的模型。

比较模型适配度

只按 Rivya 已经为每个模型记录的字段筛选：模态和支持输入。任务适配来自模型内容源，并显示在卡片上。

积分提示

每张模型卡都会显示来自目录内容的积分说明。

模态

支持输入

95 个模型候选

先比较输入、输出、积分和示例提示，再决定真正要带进候选清单的模型。

4 类模型全部

适合先看的模型

先看这个

Alibaba

Z-Image

图片

阿里巴巴轻量级文生图模型，支持 5 种宽高比，1 积分即可快速出图，适合概念草图和社交媒体素材。

推荐理由

全站最低成本，1 积分即可生成

适合任务: 低成本初步视觉概念图
输入: 文本
输出: 图片
积分: 每次生成约 1 积分起

编辑风冰饮产品微距图预览，展示冰镇主产品、冷凝水、玻璃质感、受控高光和适合活动投放的安全裁切。

单图快速输出，适合快速迭代纯文生图，支持 5 种宽高比预设

试用模型查看详情

Google

Nano Banana

图片

Google 的灵活图片模型，支持文生图、图生图、11 种宽高比、最多 10 张参考图，以及 PNG/JPEG 输出，适合人像、产品构图和更宽画幅的营销视觉。

推荐理由

11 种宽高比，含超宽 21:9 和自动模式

适合任务: 多参考图驱动的产品构图
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 3 积分起

参考风格产品视觉刷新图片预览，展示主体、构图、风格方向和可复用输出结构。

最多 10 张参考图引导创作支持 PNG 和 JPEG 输出格式

试用模型查看详情

Black Forest Labs

Flux 2 Pro

图片

Black Forest Labs 旗舰 320 亿参数模型，支持文生图和图生图，最多 8 张参考图、2K 分辨率和精准文字渲染，专为产品摄影和品牌视觉打造。

推荐理由

最高 2K 分辨率，照片级纹理细节

适合任务: 产品图和电商主视觉图
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 5 积分起

电影感护肤品棚拍图预览，展示精致美妆产品、受控反光、干净道具和可编辑品牌区域。

图片内文字和 Logo 渲染精准最多 8 张参考图保持风格/角色一致性

试用模型查看详情

OpenAI

GPT-5.5

对话

OpenAI 在 Rivya 上的高阶 GPT 对话模型，适合复杂推理、图像辅助分析、研究整合和结构化写作。

推荐理由

复杂推理和多步骤分析上限更高

适合任务: 长资料包或杂乱材料的研究整合
输入: 文本
输出: 文本 / 推理
积分: 按量付费 - 根据使用量消耗积分

让 Rivya 分析复杂简报、比较证据、理解截图，或生成结构化回答。

GPT-5.5 研究简报对话模板的线程预览。

支持视觉输入，最多 6 张图片适合结构化简报、研究整理和决策写作

试用模型查看详情

OpenAI

GPT-5.4

对话

OpenAI 在 Rivya 上更高阶的 AI 对话模型，支持更完整的结构化输入、推理强度控制与工具型对话，适合复杂分析和多步骤任务。

推荐理由

复杂分析和多步骤规划能力更强

适合任务: 长策略简报和决策备忘录
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你做更复杂的分析、研究整合、代码评审，或处理高要求的多步骤对话任务。

Rivya 高管决策备忘录提示词的对话预览。

支持视觉输入，最多 6 张图片适合结构化任务与工具调用型对话

试用模型查看详情

OpenAI

GPT-5.4 Codex

对话

OpenAI 在 Rivya 上更高阶的 Codex AI 编码模型，延续代码生成、结构化推理和工具协作能力，更适合仓库级开发项目。

推荐理由

更高规格的 Codex 推理与代码协作

适合任务: 仓库级调试和架构审阅
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你处理更复杂的代码生成、技术分析、工具协作或 `Responses` 选项任务。

Rivya Codex 发布风险提示词的对话预览。

继续支持 `Responses` 选项适合复杂代码、工具调用和多步骤任务

试用模型查看详情

OpenAI

GPT-5.3 Codex

对话

OpenAI 在 Rivya 上更强的 Codex AI 编码模型，把更先进的代码生成和更深的 agentic reasoning 合在一起，适合最高要求的开发项目。

推荐理由

OpenAI 最强代码模型

适合任务: 大型代码库里的疑难调试
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你规划、分析、打磨提示词或处理代码任务。

Rivya Codex 重构范围提示词的对话预览。

最先进的代码生成质量最深度推理，解决复杂问题

试用模型查看详情

OpenAI

GPT-5.2

对话

OpenAI 在 Rivya 上的旗舰 AI 对话模型，支持高级推理、最多 6 张图片的视觉理解和 20K 字符上下文，适合研究、规划、写作和带图分析。

推荐理由

高级推理和复杂分析

适合任务: 策略备忘录和决策文档
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你规划、分析、打磨提示词或处理代码任务。

对话策略工作流中的结构化研究简报预览。

视觉理解——分析最多 6 张图片20K 字符上下文窗口

试用模型查看详情

OpenAI

GPT-5.2 Codex

对话

OpenAI 在 Rivya 上更进阶的 Codex AI 编码模型，复杂工程任务推理更强，更适合长链路 agentic coding、架构判断和更大规模的重构工作。

推荐理由

复杂工程推理更强

适合任务: 架构评审和系统设计取舍
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你规划、分析、打磨提示词或处理代码任务。

Rivya Codex 测试计划提示词的对话预览。

更适合系统设计和架构12K 输出 Token，全面代码生成

试用模型查看详情

OpenAI

GPT-5.1 Codex

对话

OpenAI 在 Rivya 上升级版的 Codex AI 编码模型，代码准确性和推理更强，继续支持长输出和仓库级项目，更适合多文件重构与更稳的代码修改。

推荐理由

代码准确性优于 GPT-5 Codex

适合任务: 多文件重构和迁移任务
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你规划、分析、打磨提示词或处理代码任务。

Rivya Codex Diff 解释提示词的对话预览。

更擅长多文件重构12K 输出 Token 上限，适合长代码生成

试用模型查看详情

OpenAI

GPT-5 Codex

对话

OpenAI 在 Rivya 上的 GPT-5 Codex 代码专用模型，适合调试、实现规划、模块改造和面向真实代码库的技术问题求解，也支持视觉理解。

推荐理由

代码专用，12K 输出 Token 上限

适合任务: 代码审查和缺陷修复
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你规划、分析、打磨提示词或处理代码任务。

Rivya Codex 迁移计划提示词的对话预览。

针对代码生成和调试优化视觉理解，分析截图/图表

试用模型查看详情

Google

Gemini 3.1 Pro

对话

Google 在 Rivya 上最新最强的 Gemini AI 对话模型，具备顶级推理、视觉理解和指令遵循能力，更适合高要求分析和创意任务。

推荐理由

Google 最强 Gemini 模型

适合任务: 长上下文研究材料整合
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你规划、分析、打磨提示词或处理代码任务。

数据洞察叙事提示词的对话预览。

顶级推理和指令遵循视觉理解，最多 6 张图片

试用模型查看详情

Google

Gemini 3 Pro

对话

Google 在 Rivya 上更高深度的 Gemini AI 对话模型，推理强于 Gemini 2.5 Pro，并支持视觉理解，更适合研究整理、技术写作和更审慎的多模态分析。

推荐理由

推理能力优于 Gemini 2.5 Pro

适合任务: 长文分析和结构化建议
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你规划、分析、打磨提示词或处理代码任务。

竞品分析综合提示词的对话预览。

视觉理解，最多 6 张图片擅长研究综合和技术写作

试用模型查看详情

Google

Gemini 3 Flash

对话

Google 在 Rivya 上新一代快速 AI 对话模型，Token 成本比 Gemini 2.5 Flash 更低、推理更强，更适合高频多模态对话、截图分流和大吞吐助手项目。

推荐理由

全部对话模型中最低的 Token 定价

适合任务: 高频截图分析和快速分流
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你规划、分析、打磨提示词或处理代码任务。

Rivya 快速工单分流提示词的对话预览。

推理能力优于 Gemini 2.5 Flash视觉理解，最多 6 张图片

试用模型查看详情

Google

Gemini 2.5 Pro

对话

Google 在 Rivya 上更进阶的 Gemini AI 对话模型，推理能力强于 Flash，并支持视觉理解和 20K 上下文，更适合研究整理、文档分析和结构化写作。

推荐理由

推理能力强于 Gemini Flash

适合任务: 研究综合和分析写作
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你规划、分析、打磨提示词或处理代码任务。

Rivya 企业研究综合提示词的对话预览。

视觉理解——分析最多 6 张图片2 积分/次，成本均衡

试用模型查看详情

Google

Gemini 2.5 Flash

对话

Google 在 Rivya 上速度最快、成本最低的 AI 对话模型，1 积分/次，支持最多 6 张图片的视觉理解，适合快速问答、一轮摘要、截图分流和日常 AI 辅助。

推荐理由

最低成本对话模型，仅 1 积分

适合任务: 快速研究和一轮摘要
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你规划、分析、打磨提示词或处理代码任务。

结构化客服回复提示词的对话预览。

快速响应，适合实时对话视觉理解——分析最多 6 张图片

试用模型查看详情

Anthropic

Claude Opus 4.7

对话

Anthropic 在 Rivya 上的旗舰 Claude 对话模型，适合深度推理、谨慎整合、管理层写作和高影响文本任务。

推荐理由

旗舰级文本推理和资料整合能力

适合任务: 管理层备忘录和面向决策者的叙事写作
输入: 文本
输出: 文本 / 推理
积分: 按量付费 - 根据使用量消耗积分

让 Rivya 整合资料、打磨管理层备忘录、分析取舍，或审阅一个复杂文本决策。

Claude Opus 4.7 高层备忘录对话模板的线程预览。

适合长文分析与谨慎写作当前 Rivya 前台以文本 Claude 项目为主

试用模型查看详情

Anthropic

Claude Opus 4.6

对话

Anthropic 在 Rivya 上旗舰级的 Claude AI 对话模型，强调深度推理、复杂分析和高质量写作，适合关键任务和高要求场景。

推荐理由

旗舰级推理和复杂分析能力

适合任务: 高层备忘录和高要求长文写作
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你处理高复杂度分析、研究整合、关键写作或高风险代码协作。

Rivya 策略红队评审提示词的对话预览。

长文理解与高质量输出上限更高当前 Rivya 前台以纯文本 Claude 项目为主

试用模型查看详情

Anthropic

Claude Sonnet 4.6

对话

Anthropic 在 Rivya 上均衡型的 Claude AI 对话模型，延续长文理解和审慎分析能力，适合内容、研究和代码协作，又不用一开始就上 Opus 档位。

推荐理由

稳定推理和均衡质量

适合任务: 审阅长简报、PRD 和策略文档
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你分析长文、整理研究、审查代码，或打磨更高质量的结构化输出。

UX 用户访谈脚本提示词的对话预览。

长文理解与多轮对话表现可靠当前 Rivya 前台以纯文本 Claude 项目为主

试用模型查看详情

Anthropic

Claude Opus 4.5

对话

Anthropic 在 Rivya 上旗舰级的 Claude AI 对话模型，深度推理、复杂分析和专家级写作表现卓越，是关键任务的高端选择。

推荐理由

Anthropic 最强模型

适合任务: 深度研究和复杂分析
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你规划、分析、打磨提示词或处理代码任务。

Rivya 董事会风险简报提示词的对话预览。

卓越的深度推理和复杂分析专家级写作和内容质量

试用模型查看详情

Anthropic

Claude Sonnet 4.5

对话

Anthropic 在 Rivya 上均衡型的 Claude AI 对话模型，擅长细腻写作、审慎分析和更克制的响应，适合内容创作和研究。

推荐理由

细腻写作和审慎分析

适合任务: 编辑式改写和语气打磨
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你规划、分析、打磨提示词或处理代码任务。

结构化落地页转化反馈的对话预览。

安全意识强，响应校准精准当前 Rivya 前台以纯文本 Claude 项目为主

试用模型查看详情

Anthropic

Claude Haiku 4.5

对话

Anthropic 在 Rivya 上轻量型的 Claude AI 对话模型，强调速度、成本效率和稳定的日常对话表现，适合高频使用场景。

推荐理由

低延迟和高频使用更友好

适合任务: 日常收件箱分流和内部问答
输入: 文本
输出: 文本 / 推理
积分: 按量付费 — 根据使用量消耗积分

让 Rivya 帮你快速总结、轻量分析，或完成更高频、更低成本的日常协作。

Rivya 简洁回复草稿的对话预览。

token 成本显著低于 Sonnet / Opus当前 Rivya 前台以纯文本 Claude 项目为主

试用模型查看详情

Alibaba

Z-Image

图片

阿里巴巴轻量级文生图模型，支持 5 种宽高比，1 积分即可快速出图，适合概念草图和社交媒体素材。

推荐理由

全站最低成本，1 积分即可生成

适合任务: 低成本初步视觉概念图
输入: 文本
输出: 图片
积分: 每次生成约 1 积分起

编辑风冰饮产品微距图预览，展示冰镇主产品、冷凝水、玻璃质感、受控高光和适合活动投放的安全裁切。

单图快速输出，适合快速迭代纯文生图，支持 5 种宽高比预设

试用模型查看详情

Google

Nano Banana 2

图片

Google 新一代图片模型，支持 4K 分辨率、15 种宽高比（含极端 8:1）、Google 搜索增强和最多 14 张参考图——Rivya 上最灵活的图片生成器。

推荐理由

最高 4K 分辨率（1K / 2K / 4K 可选）

适合任务: 大画幅和极宽构图探索
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 5 积分起

餐饮产品故事轮播图图片预览，展示主角菜品、辅助道具、社媒构图、风格方向和可复用输出结构。

15 种宽高比，含极端 8:1 和 1:8 全景Google 搜索增强，注入真实世界上下文

试用模型查看详情

Google

Nano Banana Pro

图片

Google 高端图片模型，4K 输出、11 种宽高比、最多 8 张参考图，针对高保真品牌与营销视觉优化，细节和色彩精准度更高。

推荐理由

最高 4K 分辨率，保真度更高

适合任务: 更高完成度的品牌主视觉
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 8 积分起

11 种宽高比，支持自动检测最多 8 张参考图保持品牌一致性

试用模型查看详情

Google

Nano Banana

图片

Google 的灵活图片模型，支持文生图、图生图、11 种宽高比、最多 10 张参考图，以及 PNG/JPEG 输出，适合人像、产品构图和更宽画幅的营销视觉。

推荐理由

11 种宽高比，含超宽 21:9 和自动模式

适合任务: 多参考图驱动的产品构图
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 3 积分起

参考风格产品视觉刷新图片预览，展示主体、构图、风格方向和可复用输出结构。

最多 10 张参考图引导创作支持 PNG 和 JPEG 输出格式

试用模型查看详情

OpenAI

GPT Image 2

图片

Rivya 当前接入的 OpenAI 新一代图片模型，支持文生图、图生图、最多 16 张参考图，以及 1K / 2K / 4K 三档清晰积分。

推荐理由

同一模型页覆盖文生图和图生图

适合任务: 高分辨率商品图和广告视觉
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成 3 积分起

极简白底产品展示图片预览，展示主体、构图、风格方向和可复用输出结构。

1K、2K、4K 三档分辨率，预算更直观最多 16 张参考图，适合结构化编辑 brief

试用模型查看详情

OpenAI

GPT Image 1.5

图片

OpenAI 图片模型，支持标准/高清两档质量和最多 16 张参考图，擅长理解复杂指令并渲染空间关系准确的连贯场景。

推荐理由

最多 16 张参考图——Rivya 上最多

适合任务: 指令很多的产品图和广告视觉
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 4 积分起

角色吉祥物场景包预览图，展示全身、头像、动作姿势和小场景变化中的一致角色。

标准/高清两档质量，灵活控制成本基于 OpenAI 语言模型的卓越提示词理解

试用模型查看详情

OpenAI

4o Image

图片

4o Image 是 Rivya 里的轻量 OpenAI 文生图入口，表单只保留提示词与 3 种常用比例，适合快速验证图片想法。

推荐理由

保留独立 OpenAI 图片生成入口

适合任务: 从文字需求快速出第一版视觉方向
输入: 文本
输出: 图片
积分: 每次生成约 3 积分起

无文字电影感四分屏主视觉预览，展示同一主体在多个镜头角度中的连续呈现、平衡分屏和安全裁切边界。

轻量文生图路径，适合快速出草稿支持 1:1、3:2、2:3 三种常用比例

试用模型查看详情

ByteDance

Seedream 5.0 Lite

图片

字节跳动更轻量的 Seedream 图片模型，在 Rivya 里对文生图和图像编辑统一按固定 6 积分计费。支持 8 种宽高比、最多 14 张参考图，适合作为 Seedream 家族里更低门槛的一档。

推荐理由

文生图和图生图统一固定 6 积分

适合任务: 多参考图驱动的广告方向板和氛围探索
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 6 积分起

趣味涂鸦照片标注预览，在清晰主体周围展示手绘箭头、圈注、贴纸和可编辑边注。

最多 14 张参考图，适合引导式编辑项目8 种宽高比，包含超宽 21:9

试用模型查看详情

ByteDance

Seedream 4.5

图片

字节跳动高端图片模型，2K/4K 双档质量、8 种宽高比、最多 14 张参考图，以电影级调色和丰富纹理细节著称，擅长时尚和生活方式视觉。

推荐理由

2K（标准）和 4K（高清）双档质量可选

适合任务: 时尚和生活方式广告视觉
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 7 积分起

金黄烤鸡美食信息图图片预览，展示主体、构图、风格方向和可复用输出结构。

最多 14 张参考图引导创作8 种宽高比，含超宽 21:9

试用模型查看详情

ByteDance

Seedream 4.0

图片

Seedream 4.0 是 Rivya 里的均衡 ByteDance 图片模型，适合文生图、参考图编辑和明确输出规格的图片项目。

推荐理由

一个模型入口统一承接文生图和图片编辑

适合任务: 生活方式视觉和编辑感图片草稿
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 固定 6 积分 / 次

奢华时尚杂志拼贴海报图片预览，展示主体、构图、风格方向和可复用输出结构。

保留公开文档里的 `image_resolution` 与 `max_images` 控制项最多支持 10 张参考图进入编辑路径

试用模型查看详情

ByteDance

Seedream 3.0

图片

Seedream 3.0 是 Rivya 里的旧线 Seedream 文生图入口，适合轻量中文图片草稿、双语提示词测试和旧版视觉方向对照。

推荐理由

保留旧线 Seedream 文生图入口

适合任务: 需要保留旧版 Seedream 视觉气质的团队
输入: 文本
输出: 图片
积分: 固定 5 积分 / 次

前卫睫毛膏广告创意图片预览，展示产品主体、构图、风格方向和可复用输出结构。

参数更少，适合轻量试用参数面比新版本更轻，适合快速试用

试用模型查看详情

xAI

Grok Imagine

图片

xAI 图片模型，创意解读能力强，5 种宽高比，单图生成专注于艺术表达和非常规视觉风格。

推荐理由

创意和艺术解读能力强

适合任务: 大胆概念图和实验性视觉方向
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 4 积分起

水墨双重曝光动漫海报图片预览，展示主体、构图、风格方向和可复用输出结构。

独特视觉风格，区别于其他模型支持文生图和图生图

试用模型查看详情

Black Forest Labs

Flux 2 Pro

图片

Black Forest Labs 旗舰 320 亿参数模型，支持文生图和图生图，最多 8 张参考图、2K 分辨率和精准文字渲染，专为产品摄影和品牌视觉打造。

推荐理由

最高 2K 分辨率，照片级纹理细节

适合任务: 产品图和电商主视觉图
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 5 积分起

电影感护肤品棚拍图预览，展示精致美妆产品、受控反光、干净道具和可编辑品牌区域。

图片内文字和 Logo 渲染精准最多 8 张参考图保持风格/角色一致性

试用模型查看详情

Black Forest Labs

Flux 2 Flex

图片

Flux 2 系列的编辑专用变体，专注结构调整和风格迁移，最多 8 张参考图、2K 分辨率——适合在现有视觉基础上迭代优化。

推荐理由

针对图片编辑和风格迁移优化

适合任务: 对已有广告图或产品图继续改图
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 14 积分起

韩系街头穿搭信息图图片预览，展示主体、构图、风格方向和可复用输出结构。

最多 8 张参考图引导编辑2K 分辨率输出，Flux 2 品质

试用模型查看详情

Black Forest Labs

Flux Kontext Max

图片

Black Forest Labs 的 Flux Kontext 增强模型，面向更复杂的提示词生成和图片编辑任务。当前在 Rivya 里，文生图与图生图继续共用同一条异步项目，并统一按固定 8 积分/次执行平台定价。

推荐理由

文生图和图像编辑当前统一固定 8 积分

适合任务: 关键广告主视觉的深一层精修
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 8 积分起

墨韵羊城微观立体海报图片预览，展示主体、构图、风格方向和可复用输出结构。

在保持 Kontext 项目形态不变的前提下提供更高档位同一模型内同时支持文本生成与单图编辑

试用模型查看详情

Black Forest Labs

Flux Kontext Pro

图片

Black Forest Labs 的低门槛 Flux Kontext 选项，当前在 Rivya 上同时承接文生图、图生图和单图改图。按当前平台定价口径，这几个模式都统一按固定 4 积分结算，并继续沿现有异步图片结果链收口。

推荐理由

文生图和图像编辑当前统一固定 4 积分

适合任务: 基于 1 张已定稿素材继续做广告或社媒变体
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 4 积分起

霓虹街头服饰落地页预览图，展示主视觉服饰图、产品卡、CTA 区域和响应式裁切。

同一模型内同时支持文本生成与单图编辑内置自动翻译开关，用来承接英文提示词要求

试用模型查看详情

Alibaba

Qwen2 Image

图片

阿里 Qwen2 图片模型当前在 Rivya 里按一个固定积分图片项目接入。它安全覆盖文生图与图生图两种模式，只开放两份公开文档共同出现的宽高比子集，并保留 PNG/JPEG 输出、随机种子与简单内容过滤开关。

推荐理由

文生图和图生图统一固定 6 积分

适合任务: 中文提示词驱动的海报和广告视觉
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 6 积分起

超跑工程剖面蓝图图片预览，展示车辆轮廓、技术分层、标注区域、构图和可复用输出结构。

文生走 `qwen2/text-to-image`，带参考图时切到 `qwen2/image-edit`只开放两份公开 Qwen2 文档共同覆盖的安全宽高比集合

试用模型查看详情

Alibaba

Qwen Image

图片

阿里巴巴通义千问系列图片模型，提供高清预设尺寸（方形、竖向、横向）和 PNG/JPEG 输出，擅长中文提示词和文化细节的视觉生成。

推荐理由

高清预设尺寸：方形、竖向 4:3/16:9、横向 4:3/16:9

适合任务: 中文语境下的营销视觉
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 4 积分起

复古蓝图技术示意图图片预览，展示物件视图、尺寸标注、标签区域和旧纸纹理。

中文提示词理解能力强支持 PNG 和 JPEG 输出格式

试用模型查看详情

Midjourney

Midjourney

图片

Midjourney 的 V7 图片模型，支持文生图、图生图、Niji 动漫模式、风格参考和 Omni Reference 一致性控制，仍然是电影感艺术图、插画和风格板的行业标杆。

推荐理由

无与伦比的美学品质——行业标杆

适合任务: 电影感概念图和风格板
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 3 积分起

俯瞰颜料画布上的微缩运动者图片预览，展示主体、构图、风格方向和可复用输出结构。

V7 + V6.1 + V6 + Niji 7/6 动漫模式3 档速度：Relaxed、Fast、Turbo

试用模型查看详情

Recraft

Recraft Remove Background

图片

Recraft 在 Rivya 上的去背景模型，适合从一张现有图片里把主体干净分离出来。它更适合透明 cutout、主体分离和下一步设计前的干净源图。

推荐理由

单用途 cutout 工具，当前固定 1 积分

适合任务: 在设计前先把单张商品图、人像或目录图的背景去掉
输入: 参考素材 / 图片
输出: 图片
积分: 每次生成约 1 积分起

透明水晶腕表里的微型绿洲预览，展示清晰表壳内部的微小绿洲场景。

只围绕 1 张上传图片工作，而且通常不需要提示词更适合主体边缘清楚的商品图、人像和透明主体素材

试用模型查看详情

Recraft

Recraft Crisp Upscale

图片

Recraft 在 Rivya 上的轻量图片放大模型，适合对一张已经选定的图片做低成本锐化和清晰度补强，而不是直接上更重的交付级放大。

推荐理由

单张图片 1 积分的低成本提清步骤

适合任务: 给缩略图、社媒图或偏小的商品图补一轮快速提清
输入: 参考素材 / 图片
输出: 图片
积分: 每次生成约 1 积分起

悬浮咖啡飞溅艺术图片预览，展示悬浮咖啡主体、飞溅动态、微距风格方向和可复用输出结构。

适合发布前、交付前做轻量提清和微放大没有必须管理的尺寸档位，也不要求提示词，所以很适合做低摩擦预检

试用模型查看详情

Alibaba

Wan 2.7 Image Pro

图片

阿里更高阶的 Wan 2.7 图片模型，当前在 Rivya 里作为独立图片模型入口接入文生图与图像编辑，当前每次生成消耗 12 积分。

推荐理由

文生图和图生图统一固定 12 积分

适合任务: 品牌主视觉和发布广告静帧
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 12 积分起

印尼热食悬浮解析信息图图片预览，展示主体、构图、风格方向和可复用输出结构。

最多 9 张参考图，适合引导式编辑项目Wan 2.7 图片家族里更高阶的一档独立入口

试用模型查看详情

Alibaba

Wan 2.7 Image

图片

阿里标准档的 Wan 2.7 图片模型，当前在 Rivya 里作为独立图片模型入口接入文生图与图像编辑，当前每次生成消耗 5 积分。

推荐理由

当前每次生成消耗 5 积分

适合任务: 多参考图驱动的社媒和广告草图
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 5 积分起

超写实旅行广告图片预览，展示主体、构图、风格方向和可复用输出结构。

同时支持文生图和图生图最多 9 张参考图，适合引导式编辑

试用模型查看详情

Google

Google Imagen4 Ultra

图片

Google Imagen4 Ultra 是 Rivya 上更高档的一档 Imagen 文生图模型。当前按固定 12 积分、单张输出项目接入，并开放公开文档里可稳定承接的提示词、反向提示词、宽高比和种子参数。

推荐理由

当前固定 12 积分

适合任务: 首页主视觉图和高规格广告视觉
输入: 文本
输出: 图片
积分: 每次生成约 12 积分起

低机位奢侈时尚海报预览，焦糖色厚底乐福鞋占据前景，动态模特位于工业仓库阁楼中。

更高档的 Google Imagen 文生图入口支持反向提示词、宽高比和种子参数

试用模型查看详情

Google

Google Imagen4

图片

Google Imagen4 是 Rivya 上标准档的 Imagen 文生图模型。当前按固定 8 积分、单张输出项目接入，并开放公开文档里可稳定承接的提示词、反向提示词、宽高比和种子参数。

推荐理由

当前固定 8 积分

适合任务: 网站主视觉图和杂志感插画
输入: 文本
输出: 图片
积分: 每次生成约 8 积分起

霓虹未来科技等距卡片图片预览，展示科技模块、等距构图、暗色霓虹风格方向和可复用输出结构。

标准档 Google Imagen 文生图入口支持反向提示词、宽高比和种子参数

试用模型查看详情

Google

Google Imagen4 Fast

图片

Google Imagen4 Fast 是 Rivya 上更轻量的一档 Google Imagen 文生图模型。当前继续按单张输出项目接入，固定 4 积分，并开放公开文档中可稳定承接的提示词、反向提示词、宽高比和种子参数。

推荐理由

当前固定 4 积分

适合任务: 落地页和博客封面的初步方向图
输入: 文本
输出: 图片
积分: 每次生成约 4 积分起

巧克力甜点微距广告预览图，展示光泽馅料、层次酥皮质感、浅景深、干净道具和可编辑品牌区域。

更轻量的 Google Imagen 文生图入口支持反向提示词、宽高比和随机种子

试用模型查看详情

Topaz

Topaz Image Upscaler

图片

Topaz 在 Rivya 上的交付级图片放大模型，适合构图已经定了，只剩导出尺寸、评审分辨率或印刷清晰度还不够的静帧。

推荐理由

面向已确认静帧的交付级放大，而不是重生成构图

适合任务: 把已经确认的电商图、产品图或广告静帧放大到更适合交付的尺寸
输入: 参考素材 / 图片
输出: 图片
积分: 每次处理约 5 积分起

天空岛生态系统图片预览，展示漂浮地形、植被、云层深度、构图和可复用输出结构。

基于 factor 1、2、4、8 的前台档位，让尺寸和成本取舍更容易判断当静帧已经定稿、目标尺寸本身真的重要时，比 Recraft Crisp Upscale 更合适

试用模型查看详情

Ideogram

Ideogram V3

图片

Ideogram V3 是 Rivya 里偏文字渲染、海报版式和设计导向的文生图模型。当前价格为：TURBO 4 积分，BALANCED 7 积分，QUALITY 10 积分。

推荐理由

渲染速度分档：TURBO、BALANCED、QUALITY

适合任务: 海报概念和标题导向的广告图
输入: 文本
输出: 图片
积分: 每次生成约 4 积分起

现代日常流程信息图预览图，展示可编辑时间区块、图标、层级和可复用输出结构。

偏设计导向的 Ideogram V3 文生图能力支持 MagicPrompt 扩展开关

试用模型查看详情

Ideogram

Ideogram V3 Reframe

图片

Ideogram V3 Reframe 当前在 Rivya 上按渲染速度分档接入单图重构项目。当前价格为：TURBO 4 积分，BALANCED 7 积分，QUALITY 10 积分。

推荐理由

渲染速度分档：TURBO、BALANCED、QUALITY

适合任务: 把一张已定稿视觉改成新比例
输入: 参考素材 / 图片
输出: 图片
积分: 每次生成约 4 积分起

霓虹品牌办公展位渲染预览图，展示模块墙板、灯光强调、标识区域和干净交付裁切。

单图重构项目当前模型允许空 prompt

试用模型查看详情

Ideogram

Ideogram V3 Remix

图片

Ideogram V3 Remix 当前在 Rivya 上按渲染速度分档接入单图重混项目。当前价格为：TURBO 4 积分，BALANCED 7 积分，QUALITY 10 积分。

推荐理由

渲染速度分档：TURBO、BALANCED、QUALITY

适合任务: 围绕 1 张源图尝试不同视觉方向
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 4 积分起

粉色护肤广告预览图，主打产品旁有气球般柔软形态、光泽膏体、粉彩布光和可编辑标签区。

单图重混项目支持 MagicPrompt、strength 和反向提示词

试用模型查看详情

Ideogram

Ideogram Character

图片

面向角色一致性的专门入口，把 1 张已经定下来的角色图延展到新场景、新服装和新尺寸。适合你更在意身份保留，而不是开放式图片编辑，并且一次只需要 1 张输出图。

推荐理由

围绕单角色参考图工作，重点是跨场景保持同一角色可辨认

适合任务: 让同一个吉祥物、头像角色或插画人物在很多新场景里都保持可辨认
输入: 文本 / 参考素材 / 图片
输出: 图片
积分: 每次生成约 12 积分起

云朵鞋跳跃广告预览，展示主角鞋在柔软云朵形态中跃起，并带有干净产品光线。

和 Ideogram V3 / Reframe / Remix 明确分开，方便用户优先选择一致性而不是泛编辑单图输出，配合 TURBO / BALANCED / QUALITY 三档积分更容易预估成本

试用模型查看详情

ByteDance

Seedance 2.0

视频

字节跳动完整版 Seedance 2.0 视频模型，当前在 Rivya 里完整接入了文生视频、首帧/首尾帧驱动，以及多模态参考生视频三类场景。产品层保留了与文档一致的角色拆分，避免把首尾帧和参考图/参考视频/参考音频混成一个模糊上传桶。

推荐理由

完整覆盖文生、首尾帧、多模态参考三类场景

适合任务: 从提示词、首尾帧或参考包生成更高质量短片
输入: 文本
输出: 视频
积分: 每次生成约 64 积分起

一个模型入口容纳提示词、首尾帧和多模态参考项目480p / 720p 输出与 adaptive 宽高比支持

试用模型查看详情

ByteDance

Seedance 2.0 Fast

视频

字节跳动更快的 Seedance 2.0 视频模型，当前在 Rivya 里完整接入了文生视频、首帧/首尾帧驱动，以及多模态参考生视频三类场景。为了避免首尾帧和参考图/参考视频/参考音频的角色混淆，产品层保持了与文档一致的显式场景拆分。

推荐理由

完整覆盖文生、首尾帧、多模态参考三类场景

适合任务: 从提示词或分镜帧快速做广告预演
输入: 文本
输出: 视频
积分: 每次生成约 52 积分起

480p / 720p 输出与 adaptive 宽高比支持可选同步音频生成和返回最后一帧

试用模型查看详情

ByteDance

Seedance 1.5 Pro

视频

字节跳动的旗舰视频模型，支持文生视频、图生视频、原生音视频同步、480p–1080p、4–12 秒片段、6 种宽高比、动态/固定镜头控制，以及唇形同步。

推荐理由

原生音视频同步，唇形精准匹配

适合任务: 需要音视频同步的短片
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 每次生成约 28 积分起

480p / 720p / 1080p 分辨率可选4 秒、8 秒、12 秒可配置片段时长

试用模型查看详情

ByteDance

Seedance 1.0 Pro

视频

字节跳动 Seedance 1.0 Pro 模型，当前在 Rivya 里作为 Seedance 1.0 标准 Pro 路径接入文生视频和图生视频。产品面保持与公开 V1 Pro 文档对齐，开放分辨率、时长、锁定镜头、随机种子和安全检查参数。

推荐理由

同时支持文生视频和图生视频

适合任务: 短视频电影感生成
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 每次生成约 25 积分起

480p、720p、1080p 三档分辨率5 秒和 10 秒时长控制

试用模型查看详情

ByteDance

Seedance 1.0 Pro Fast

视频

字节跳动快速图生视频模型，将单张参考图动画化为 5 秒或 10 秒片段（720p/1080p）——需要从静态图快速出视频时的最优选择。

推荐理由

图生视频专精——快速出片

适合任务: 从单张图片快速起动态
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 16-72 积分 / 次

720p 和 1080p 分辨率可选5 秒或 10 秒片段时长

试用模型查看详情

ByteDance

Seedance 1.0 Lite

视频

字节跳动 Seedance 1.0 Lite 模型，当前在 Rivya 里作为更轻量的 1.0 路径接入文生视频和图生视频。参数面继续对齐公开 V1 Lite 文档，当前价格也保持在比 Seedance 1.0 Pro 更低的一档。

推荐理由

同时支持文生视频和图生视频

适合任务: 更低成本的分镜测试
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 每次生成约 16 积分起

当前价格低于 Seedance 1.0 Pro图生视频支持第 2 张图作为可选尾帧

试用模型查看详情

HappyHorse

HappyHorse 1.0

视频

Rivya 上灵活的视频模型，一个公开模型页同时支持文生视频、单图图生视频、多图参考视频和视频编辑。

推荐理由

一个模型页覆盖文本、图片、参考图和视频编辑工作流

适合任务: 从文字简报生成广告或产品动态草案
输入: 文本 / 参考素材 / 图片 / 视频
输出: 视频
积分: 每次生成约 28 积分起

支持 720p 和 1080p 两档固定价格无视频时最多支持 9 张图片参考

试用模型查看详情

Alibaba

Wan 2.7 Video

视频

阿里更新一代 Wan 视频模型，当前在 Rivya 里按分辨率和时长计费。产品层目前统一开放文生视频、图生视频和视频编辑，5 秒 720p 从 80 积分起。

推荐理由

按分辨率和时长计费：720p = 16 积分/秒，1080p = 24 积分/秒

适合任务: 短片产品宣传片和社媒短切版
输入: 文本 / 参考素材 / 图片 / 视频
输出: 视频
积分: 每次生成 80 积分起

一个模型入口覆盖文生视频、图生视频和视频编辑图生视频支持单图或首尾帧双图

试用模型查看详情

Alibaba

Wan 2.6

视频

阿里 Wan 家族在 Rivya 上的三模式重项目：文生视频、图生视频和源视频改写都放在同一条选项上。当前支持 720p / 1080p、5–15 秒，并且一次只承接 1 张图片或 1 段源视频。

推荐理由

三模式：文生视频 + 图生视频 + 视频生视频

适合任务: 从现有源视频继续做 video-to-video 编辑
输入: 文本 / 参考素材 / 图片 / 视频
输出: 视频
积分: 每次生成约 70 积分起

一条更重的 Wan 选项，同时支持从现有源视频起步，而不只是文本或静帧一次只用 1 张图片或 1 段源视频，编辑路径更清楚

试用模型查看详情

Alibaba

Wan 2.5 Video

视频

Wan 2.5 当前在 Rivya 上统一承接文生视频与图生视频，当前价格为：`720p_5 = 60`、`720p_10 = 120`、`1080p_5 = 100`、`1080p_10 = 200`。

推荐理由

一个模型入口统一承接文生视频与图生视频

适合任务: 用文本或 1 张主视觉生成 5 秒 / 10 秒 Wan 宣传短片
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 每次生成 60 积分起

当前按 4 档清晰价格执行继续沿用现有异步视频结果链，不新增结果类型

试用模型查看详情

Alibaba

Wan 2.2 A14B Turbo

视频

Wan 2.2 A14B Turbo 当前在 Rivya 上统一承接文生视频、图生视频，以及需要 1 张图片加 1 段音频的语音驱动视频。当前价格为：文生/图生 `480p = 8`、`720p = 12`；图片+音频驱动 `480p = 16`、`580p = 20`、`720p = 24`。

推荐理由

一个模型入口统一承接文生、图生和图片+音频驱动视频

适合任务: 较轻量的 Wan 文生视频尝试
输入: 文本 / 参考素材 / 图片 / 音频
输出: 视频
积分: 8 积分 / 次起

文生/图生与图片+音频驱动视频分别按当前价格分层执行图片+音频驱动视频保留了自己独立的一组高级参数子集

试用模型查看详情

Alibaba

Wan 动画替换

视频

Wan 在 Rivya 上的角色替换视频模型，适合把已有视频里出现的人物或主体换掉。它适合动作已经对了，只需要 1 条公开源视频 URL、1 条公开替换图 URL 和分辨率档位的情况。

推荐理由

保持公开接口的 `video_url + image_url + resolution` 形状，不额外造出 prompt 型项目

适合任务: 在保留源视频动作的前提下替换画面中的人物或主体
输入: 视频
输出: 视频
积分: 12 积分 / 次起

更适合做主体或角色替换，而不是重新生成整条视频当源视频和替换图片都已经放在公开存储上时，项目最顺手

试用模型查看详情

MiniMax

Hailuo 2.3

视频

MiniMax 的图生视频模型，支持 Standard/Pro 双档质量、768P/1080P 分辨率、6 秒或 10 秒片段，以更顺滑的运动和自然过渡著称。

推荐理由

Standard 和 Pro 双档质量

适合任务: 把人像或时尚静帧转成动态片段
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 每次生成约 25 积分起

768P 和 1080P 分辨率可选6 秒或 10 秒可配置片段时长

试用模型查看详情

MiniMax

Hailuo Pro

视频

MiniMax 旧版 Hailuo Pro 视频模型，当前按固定 Pro 档位接入，统一支持文生视频和图生视频。图生侧可上传 1 到 2 张参考图，第二张会作为尾帧图参与生成，当前每次生成消耗 57 积分。

推荐理由

同一模型支持文生视频和图生视频

适合任务: 从 1 张关键视觉做更高质量的动态草稿
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 57 积分 / 次

图生侧支持首图或首尾帧双图当前按公开可确认的 Pro 固定档位接入

试用模型查看详情

MiniMax

Hailuo Standard

视频

MiniMax 旧线 Hailuo Standard 视频模型，支持文生视频和图生视频。图生侧可上传 1 到 2 张参考图，第二张会作为尾帧图参与生成。

推荐理由

同一模型支持文生视频和图生视频

适合任务: 把 1 张主视觉快速变成短预告片
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 12-50 积分 / 次

图生侧支持首图或首尾帧双图512P 与 768P 图生档位可选

试用模型查看详情

Kuaishou

Kling 3.0

视频

快手的高端视频模型，支持文生视频、图生视频、Standard (720P) / Pro (1080P) 双档、单/多镜头结构、3–15 秒时长、可选音频，以及最多 2 张参考图。

推荐理由

Standard (720P) 和 Pro (1080P) 双档质量

适合任务: 需要明确镜头结构的广告预演和分镜稿
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 每次生成约 42 积分起

单镜头或多镜头生成模式灵活的 3–15 秒片段时长

试用模型查看详情

Kuaishou

Kling 3.0 motion-control

视频

更新一代的 Kling 动作控制项目，用 1 张参考图加 1 段动作视频驱动同一主体，并多了背景来源选择。适合你不仅要做动作迁移，还要决定最终场景更像视频环境还是参考图世界。

推荐理由

严格的 1 图 + 1 动作视频项目，身份和动作来源划分很清楚

适合任务: 需要明确决定背景来自动作视频还是参考图片的动作迁移任务
输入: 文本 / 参考素材 / 图片 / 视频
输出: 视频
积分: 每次生成约 20 积分起

相比 Kling 2.6 motion-control，多了 `background_source` 这个真正关键的升级点Standard (720P) / Pro (1080P) 价格固定为 20 / 27 积分

试用模型查看详情

Kuaishou

Kling 2.6

视频

快手视频模型，可选音频生成、5/10 秒片段、3 种宽高比，擅长人物运动和表情丰富的角色动画，物理效果自然。

推荐理由

可选音频与视频同步生成

适合任务: 人物表现和更有表情的运动镜头
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 每次生成约 55 积分起

5 秒或 10 秒片段时长3 种宽高比：1:1、16:9、9:16

试用模型查看详情

Kuaishou

Kling 2.6 motion-control

视频

更偏轻量和低成本的 Kling 动作迁移项目，用 1 张参考图加 1 段动作视频驱动同一主体。适合想先做便宜一档的 motion-control 测试，又不需要 Kling 3.0 那组额外场景控制时使用。

推荐理由

严格的 1 图 + 1 动作视频项目，角色身份和动作来源非常清楚

适合任务: 用 1 张静态角色图加 1 段动作参考视频驱动同一主体
输入: 文本 / 参考素材 / 图片 / 视频
输出: 视频
积分: 每次生成约 16 积分起

相较 Kling 3.0 motion-control 更便宜，当前只要 16 / 22 积分提示词可选，方便让上传的动作视频继续做主要驱动

试用模型查看详情

Kuaishou

Kling V2.5 Turbo Pro

视频

快手可灵 V2.5 Turbo Pro 视频模型，当前同时支持文生和图生。当前价格为：5 秒 42 积分，10 秒 84 积分。

推荐理由

公开文生和图生价格档位都明确

适合任务: 从文本或首尾帧起步的短广告预演
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 42-84 积分 / 次

文生与图生都纳入同一独立模型图生支持首图和可选尾帧图

试用模型查看详情

Kuaishou

Kling V2.1 Master

视频

快手可灵旧版 V2.1 Master 视频模型，当前同时支持文生和图生。当前价格为：5 秒 160 积分，10 秒 320 积分。

推荐理由

5 秒与 10 秒都提供固定价格档位

适合任务: 旧版 Kling Master 和新档位的对照测试
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 160-320 积分 / 次

文生与图生都已纳入同一独立模型文生支持 `aspect_ratio`，图生继续只暴露公开字段

试用模型查看详情

Kuaishou

Kling V2.1 Pro

视频

快手可灵旧版 V2.1 Pro 图生视频模型，支持首图与可选尾帧双图。当前价格为：5 秒 50 积分，10 秒 100 积分。

推荐理由

只保留图生视频，路径更收敛

适合任务: 已有首尾帧的过渡镜头测试
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 50-100 积分 / 次

支持首图和可选尾帧双图5 秒与 10 秒都提供固定价格档位

试用模型查看详情

Kuaishou

Kling V2.1 Standard

视频

快手可灵旧版 V2.1 Standard 图生视频模型，当前价格为：5 秒 25 积分，10 秒 50 积分。

推荐理由

只保留图生视频路径

适合任务: 把 1 张产品图快速变成动态草稿
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 25-50 积分 / 次

5 秒与 10 秒都提供固定价格档位支持 `negative_prompt` 与 `cfg_scale`

试用模型查看详情

Kuaishou

Kling AI Avatar Pro

视频

快手可灵 AI Avatar Pro 高质量数字人口播模型，固定使用 1 张人物图和 1 段音频生成口型同步视频。Rivya 当前按固定 16 积分 / 次接入。

推荐理由

固定图片 + 音频驱动的高质量数字人口播流程

适合任务: 高质量数字人口播视频
输入: 文本 / 参考素材 / 图片 / 音频
输出: 视频
积分: 16 积分 / 次

当前固定 16 积分更适合质量优先的口型同步视频

试用模型查看详情

Kuaishou

Kling AI Avatar Standard

视频

快手可灵 AI Avatar Standard 数字人口播模型，固定使用 1 张人物图和 1 段音频生成口型同步视频。Rivya 当前按固定 8 积分 / 次接入。

推荐理由

固定图片 + 音频驱动的数字人口播流程

适合任务: 数字人口播视频
输入: 文本 / 参考素材 / 图片 / 音频
输出: 视频
积分: 8 积分 / 次

当前固定 8 积分口型同步路径清晰

试用模型查看详情

MeiGen-AI

Infinitalk

视频

Infinitalk 是一个基于图片和音频生成数字人口播视频的模型。当前价格按分辨率和音频时长计算：480p = 3 积分 / 秒，720p = 12 积分 / 秒。

推荐理由

固定图片 + 音频驱动的视频生成流程

适合任务: 数字人口播
输入: 文本 / 参考素材 / 图片 / 音频
输出: 视频
积分: 3 或 12 积分 / 秒

按分辨率和音频时长计算积分支持 480p / 720p 两档分辨率

试用模型查看详情

Runway

Runway

视频

Runway 是一个支持文生视频和图生视频的独立视频模型。当前公开价格只明确覆盖 6 个生成档位，因此 Rivya 先按可确认的 `720p_5 = 12`、`720p_10 = 30`、`1080p_5 = 30` 接入。

推荐理由

公开文生和图生价格档位都明确

适合任务: 5 秒品牌预告短片和社媒广告草稿
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 12-30 积分 / 次

文生与图生共用同一独立模型文生支持 `aspectRatio`，图生自动沿用图片宽高比

试用模型查看详情

Runway

Runway Aleph

视频

面向已有源视频的视频改写项目。适合运动和镜头基础来自你的输入素材，而视觉方向由提示词决定，当前固定 90 积分。

推荐理由

围绕 1 段源视频工作，动作基础来自你的素材而不是空白生成

适合任务: 把已经通过的源视频改成另一种视觉方向或氛围
输入: 文本 / 参考素材 / 视频 / 图片
输出: 视频
积分: 90 积分 / 次

提示词驱动改写，可选再加 1 张参考图辅助风格或主体方向和普通 Runway 5 秒 / 10 秒文生图生路径明确分开

试用模型查看详情

Luma

Luma Modify Video

视频

独立的 source-video 改写入口，用来把一条现有视频推向新的视觉方向。适合你要的是 prompt 驱动改写，而不是单纯提高清晰度。

推荐理由

专门做 source-video 改写，不是单纯 enhancement

适合任务: 把一条已确认的源视频改成另一种氛围、风格或视觉方向
输入: 参考素材 / 视频
输出: 视频
积分: 30 积分 / 次

更适合短视频、单一改写目标，以及 1 条以英文为主的提示词当你想改画面气质、氛围或视觉方向时，比 upscale 更合适

试用模型查看详情

xAI

Grok Imagine Video

视频

xAI 视频模型，Fun/Normal/Spicy 三种创意模式和 5 种宽高比，独特风格预设覆盖从趣味到电影到前卫的不同创意调性。

推荐理由

独特的 Fun / Normal / Spicy 创意模式

适合任务: 风格化预告短片和社媒短片
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 每次生成约 10 积分起

支持 480p / 720p 两档分辨率并按秒计费支持 6 到 30 秒时长

试用模型查看详情

OpenAI

Sora 2 Pro

视频

Sora 2 高端版，Standard/High 双档质量、10/15 秒片段、水印移除，细节、光影和运动保真度更高，适合专业视频制作。

推荐理由

Standard 和 High 双档质量，适合制作级使用

适合任务: 高端产品短片和发布视频
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 每次生成约 75 积分起

细节、光影和运动保真度更高10 秒或 15 秒片段，支持 10K 字符提示词

试用模型查看详情

OpenAI

Sora 2

视频

OpenAI 的视频模型，支持文生视频、图生视频、同步音频、真实物理模拟、10/15 秒片段、横向/竖向输出，以及可选水印移除。

推荐理由

物理精准的世界模拟

适合任务: 产品发布和品牌短片的电影感预告短片
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 每次生成约 6 积分起

10 秒或 15 秒片段，支持 10K 字符长提示词横向和竖向方向可选

试用模型查看详情

OpenAI

Sora Watermark Remover

视频

Rivya 上面向公开 Sora 分享链接的去水印后处理模型。它适合 Sora 视频已经生成完成，剩下只是去水印，并顺手决定结果走 S3 还是 OSS。

推荐理由

专门面向公开 `sora.chatgpt.com` 分享链接，不是泛用视频上传工具

适合任务: 在交付前移除公开 Sora 分享链接上的水印
输入: 视频
输出: 视频
积分: 每次固定 3 积分

把去水印和 Sora 2 / Sora 2 Pro 生成明确分开在 Rivya 上只有两个关键输入：公开视频链接和输出存储位置

试用模型查看详情

Topaz

Topaz Video Upscaler

视频

Topaz 在 Rivya 上的交付级视频放大模型，适合镜头、动作和节奏都已经定了，只剩导出分辨率和最终清晰度还不够的成片。

推荐理由

更适合已经确认内容不变，只差导出清晰度的成片

适合任务: 在客户交付、演示或正式发布前，把已确认视频再提清一轮
输入: 参考素材 / 视频
输出: 视频
积分: 12 积分 / 次

单视频、无提示词的流程，更像后期提清步骤，而不是重做镜头1x、2x、4x 三档简单清楚，而且当前都落在固定 12 积分档

试用模型查看详情

Google

Veo3.1 Quality

视频

Google Veo 3.1 品质优先版，适合高规格的文生视频与图片驱动生成。更高保真的画面、更稳的运动真实感，以及默认带背景音频，使它成为 Rivya 上更高阶的 Veo 选项。

推荐理由

Rivya 上更高阶的 Veo 输出路径

适合任务: 主发布影片和高端品牌片
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 每次生成约 150 积分起

更适合主视觉影片和品牌成片默认带背景音频

试用模型查看详情

Google

Veo3.1 Fast

视频

Google Veo 3.1 快速版，三模式支持：文生视频、图生视频、参考图生视频。最多 3 张参考图、原生音频，以及按模式区分的宽高比控制，适合快速试用电影感片段。

推荐理由

三模式：文字 / 图片 / 参考图生视频

适合任务: 带原生音频的广告概念短片
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 每次生成约 20 积分起

最多 3 张参考图引导生成原生音频与视频同步生成

试用模型查看详情

Google

Veo3.1 Lite

视频

Google Veo 3.1 的最低成本档。Rivya 当前只开放最小稳定子集：文生视频和图生视频，固定 `10` 积分 / 次。

推荐理由

文生视频和图生视频在 Rivya 上都固定为 10 积分

适合任务: 先低成本验证 Veo 方向，再进入升级
输入: 文本 / 参考素材 / 图片
输出: 视频
积分: 10 积分 / 次

以当前最低成本承接 Veo 3.1 基础生成链路同时支持纯提示词和图片驱动生成

试用模型查看详情

Suno

Suno Music

音频

Suno Music 是 Rivya 里的文本生成音乐模型，适合把一句简短需求直接变成有人声或纯音乐的歌曲草稿。它保持固定 `12` 积分入口，并在成功结果后继续提供 `Extend Music`。

推荐理由

公开定价固定为 12 积分 / 次

适合任务: 验证一首歌的风格方向，再进入继续做长
输入: 文本
输出: 音频
积分: 12 积分 / 次

首版只做最小生成子集，避免一次接入整族能力成功结果可继续发起 Extend Music 动作

试用模型查看详情

Suno

Suno Sounds

音频

Suno Sounds 是 Rivya 里的轻量文本生成声音模型，适合做环境循环、背景音和短声音草稿。它保持公开定价固定 `3` 积分 / 次，并支持从成功结果继续做 `Vocal Separation`。

推荐理由

公开定价固定为 3 积分 / 次

适合任务: 快速生成环境音、loop 和氛围底声
输入: 文本
输出: 音频
积分: 3 积分 / 次

首版只开放循环、BPM 和 Key 这组最低风险参数继续沿现有 Suno 音频结果链返回普通音频 URL

试用模型查看详情

Suno

Suno Lyrics

音频

Suno Lyrics 是 Rivya 里的歌词生成模型，适合把一个主题、情绪或故事线直接变成歌曲文本，每次生成消耗 `1` 积分。

推荐理由

当前每次生成消耗 1 积分

适合任务: 在做歌曲前先把歌词草稿写顺
输入: 文本
输出: 音频
积分: 1 积分 / 次

只开放最低风险的 prompt 单参数子集沿用现有异步任务流，同时允许没有媒体 URL 也能成功

试用模型查看详情

ElevenLabs

ElevenLabs Dialogue V3

音频

ElevenLabs 在 Rivya 上的多角色对白模型，适合生成带有说话人切换节奏的对话音频，用于播客、访谈和角色对白。

推荐理由

多角色对白生成

适合任务: 双主持播客开场和对谈片段
输入: 文本
输出: 音频
积分: 根据时长或长度消耗积分

每个角色独立语音分配可调节稳定性保持一致表达

试用模型查看详情

ElevenLabs

ElevenLabs Turbo 2.5

音频

ElevenLabs 在 Rivya 上的快速文本转语音模型，低延迟语音生成并支持稳定性、相似度、风格和速度调节，适合快节奏配音和口播试稿。

推荐理由

最快的 ElevenLabs TTS——低延迟优化

适合任务: 产品演示、App walkthrough 和广告配音
输入: 文本
输出: 音频
积分: 根据时长或长度消耗积分

可调节稳定性、相似度、风格和速度多种语音预设，上下文感知生成

试用模型查看详情

ElevenLabs

ElevenLabs Multilingual V2

音频

ElevenLabs 在 Rivya 上的多语言文本转语音模型，支持约 30 种语言自动检测，更适合全球内容本地化和跨语言配音。

推荐理由

自动检测并生成约 30 种语言

适合任务: 多语言产品演示和 onboarding 视频旁白
输入: 文本
输出: 音频
积分: 根据时长或长度消耗积分

拟人化语调和音调细腻变化同样的语音控制：稳定性、相似度、风格、速度

试用模型查看详情

ElevenLabs

ElevenLabs Sound Effect V2

音频

ElevenLabs 在 Rivya 上的文本生成音效模型，适合做短音效、转场声和可循环环境底音。你可以生成 0.5–22 秒音频片段，并控制提示词影响强度、循环模式和 19 种输出格式。

推荐理由

0.5–22 秒可配置音频时长

适合任务: 按钮音、通知音和交互反馈声
输入: 文本
输出: 音频
积分: 根据时长或长度消耗积分

可调提示词影响强度循环模式生成无缝重复音频

试用模型查看详情

ElevenLabs

ElevenLabs Audio Isolation

音频

ElevenLabs 在 Rivya 上的音频清理与人声分离模型，上传现有录音即可做人声分离、降噪和 spoken audio 清理。

推荐理由

上传即用的音频分离——无需提示词

适合任务: 剪辑前清理采访和播客录音
输入: 参考素材 / 音频
输出: 音频
积分: 根据时长或长度消耗积分

人声分离和背景噪音去除按音频时长计费

试用模型查看详情

已经挑出几款想试的模型了？

先在这里完成筛选，再进 Rivya 里实际试跑，不用在不同工具、钱包和历史记录之间来回切换。

注册并开始测试查看价格

新用户送 6 积分

几秒完成注册