Catálogo de modelos de IA

Compare modelos de imagem, vídeo, áudio e chat antes de gastar créditos

Explore 95+ modelos de IA por tarefa, entrada, saída, provedor e notas de crédito. Veja onde cada modelo funciona melhor, revise exemplos reais e leve sua lista de candidatos para a Rivya para um teste real.
6 créditos de cadastro
Cadastro rápido
ImagemVídeoÁudioChat

Catálogo de modelos

Encontre modelos por tarefa, entrada e saída

Filtre por modalidade, tipo de entrada, provedor, pontos fortes e notas de crédito. Abra uma página de modelo para ver resultados reais, ajuste à tarefa e um teste online rápido.

4 tipos de modelo

Todos os modelos

Busque por modelo, fornecedor, capacidade ou tarefa. Depois use filtros factuais para estreitar a página sem abrir todos os detalhes.

95 opções de modelo

Compare entrada, saída, créditos e pistas de exemplo antes de se comprometer com uma lista de candidatos.

Comparar ajuste dos modelos

Filtre pelos campos que a Rivya já rastreia para cada modelo: modalidade e entrada compatível. O ajuste à tarefa aparece nos cartões a partir da fonte de conteúdo do modelo.

Pista de créditos

A orientação de créditos aparece em cada cartão de modelo a partir do conteúdo do catálogo.

Modalidade

Entrada compatível

95 opções de modelo

Compare entrada, saída, créditos e pistas de exemplo antes de se comprometer com uma lista de candidatos.

4 tipos de modeloTodos

Bons modelos para começar

Comece por aqui

Alibaba

Z-Image

Imagem

Modelo leve de texto para imagem da Alibaba. Geração rápida de imagem única com 5 proporções, ideal para rascunhos rápidos de conceito e visuais de mídia social por apenas 1 crédito.

Por que escolher

Menor custo, com 1 crédito por geração

Melhor para
Conceitos visuais baratos de primeira passada
Entrada
Texto
Saída
Imagem
Créditos
A partir de 1 crédito por geração
Saída rápida de imagem única para iteração velozTexto para imagem limpo com 5 presets de proporção

Google

Nano Banana

Imagem

Modelo de imagem flexível do Google para texto para imagem e imagem para imagem, com 11 proporções de tela, até 10 imagens de referência e saída PNG/JPEG. Uma opção forte para retratos, composições de produto e visuais mais largos de landing page.

Por que escolher

11 proporções de tela, incluindo 21:9 ultra-wide e modo automático

Melhor para
Composições de produto com várias referências visuais
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 3 créditos por geração
Até 10 imagens de referência para criação guiadaOpções de formato de saída PNG e JPEG

Black Forest Labs

Flux 2 Pro

Imagem

O modelo principal de 32B parâmetros da Black Forest Labs. Oferece suporte a texto para imagem e imagem para imagem com até 8 imagens de referência, resolução 2K e renderização precisa de texto — criado para fotos de produto e visuais de marca.

Por que escolher

Até resolução 2K com texturas fotorrealistas

Melhor para
Fotos estáticas de produto e imagens principais de ecommerce
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 5 créditos por geração
Renderização precisa de texto e logotipos em imagensAté 8 imagens de referência para consistência de estilo/personagem

OpenAI

GPT-5.5

Chat

O modelo avançado de chat GPT da OpenAI na Rivya para raciocínio complexo, análise com imagens, síntese de pesquisa e escrita estruturada quando o brief precisa de mais espaço.

Por que escolher

Teto alto para raciocínio complexo e análise em múltiplas etapas

Melhor para
Síntese de pesquisa em pacotes de fontes longos ou desorganizados
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Suporta chat com imagens com até 6 imagensBoa escolha para briefs estruturados, síntese de pesquisa e escrita de decisão

OpenAI

GPT-5.4

Chat

O modelo de chat de IA mais avançado da OpenAI na Rivya, com tratamento mais forte de entradas estruturadas, controle de raciocínio e projetos de conversa orientados a ferramentas para tarefas mais complexas de análise e escrita.

Por que escolher

Análise complexa e planejamento em múltiplas etapas mais fortes

Melhor para
Briefs estratégicos longos e memorandos de decisão
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Suporte visual com até 6 imagensBom para tarefas estruturadas e conversas orientadas a ferramentas

OpenAI

GPT-5.4 Codex

Chat

O modelo Codex de nível mais alto da OpenAI na Rivya, com codificação mais forte, raciocínio estruturado e colaboração orientada a ferramentas para projetos de desenvolvimento exigentes em escala de repositório.

Por que escolher

Raciocínio Codex de nível mais alto e colaboração em codificação

Melhor para
Depuração em escala de repositório e revisão de arquitetura
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Mantém o projeto ResponsesBom para código complexo, uso de ferramentas e trabalho técnico em múltiplas etapas

OpenAI

GPT-5.3 Codex

Chat

O modelo Codex mais recente e capaz da OpenAI na Rivya. Ele combina geração de código de ponta com raciocínio mais profundo para agentes nos projetos de desenvolvimento mais exigentes.

Por que escolher

Modelo de código mais capaz da OpenAI

Melhor para
Depuração difícil em grandes bases de código
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Qualidade de geração de código de pontaRaciocínio mais profundo para problemas complexos

OpenAI

GPT-5.2

Chat

O modelo principal de chat de IA da OpenAI na Rivya, com raciocínio avançado, suporte visual para até 6 imagens e janela de contexto de 20K caracteres. É uma opção GPT geral forte para pesquisa, planejamento, escrita e análise com imagens.

Por que escolher

Raciocínio avançado e análise complexa

Melhor para
Memorandos de estratégia e documentos de decisão
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Suporte visual — analise até 6 imagensJanela de contexto de 20K caracteres

OpenAI

GPT-5.2 Codex

Chat

O modelo Codex mais avançado da OpenAI na Rivya, com raciocínio mais forte para tarefas complexas de engenharia. Ele é otimizado para codificação com agentes em horizontes longos, decisões de arquitetura e refatorações maiores em que geração simples de código não basta.

Por que escolher

Raciocínio mais forte para engenharia complexa

Melhor para
Revisões de arquitetura e decisões de desenho de sistemas
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Melhor para desenho de sistemas e arquitetura12K tokens de saída para geração abrangente de código

OpenAI

GPT-5.1 Codex

Chat

O modelo Codex atualizado da OpenAI na Rivya, com maior precisão de código e raciocínio mais forte para tarefas de codificação com agentes. Ele mantém o mesmo projeto ciente do repositório e com saída longa, ao mesmo tempo em que melhora refatorações de múltiplos arquivos e edições de código mais seguras.

Por que escolher

Precisão de código melhorada em relação ao GPT-5 Codex

Melhor para
Refatorações e migrações de múltiplos arquivos
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Melhor em refatoração de múltiplos arquivosLimite de 12K tokens de saída para geração longa de código

OpenAI

GPT-5 Codex

Chat

O modelo GPT-5 Codex especializado em código da OpenAI na Rivya para depuração, planejamento de implementação, refatorações e solução de problemas técnicos com suporte visual.

Por que escolher

Especializado em código com limite de 12K tokens de saída

Melhor para
Revisão de código e correção de bugs
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Otimizado para geração de código e depuraçãoSuporte visual para analisar capturas de tela e diagramas

Google

Gemini 3.1 Pro

Chat

O modelo de chat Gemini com IA mais recente e capaz do Google na Rivya. Com raciocínio de ponta, suporte visual e seguimento de instruções, é a opção Gemini mais forte para tarefas analíticas e criativas exigentes.

Por que escolher

Modelo Gemini mais capaz do Google

Melhor para
Pacotes de pesquisa de contexto longo e trabalhos de comparação
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Raciocínio e seguimento de instruções de pontaSuporte visual com até 6 imagens

Google

Gemini 3 Pro

Chat

O modelo de chat Gemini com IA de maior profundidade do Google na Rivya. Com raciocínio mais forte que Gemini 2.5 Pro e suporte visual, ele é mais adequado para síntese de pesquisa, escrita técnica e análise multimodal mais deliberada.

Por que escolher

Raciocínio aprimorado em relação ao Gemini 2.5 Pro

Melhor para
Análise de formato longo e recomendações estruturadas
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Suporte visual com até 6 imagensForte em síntese de pesquisa e escrita técnica

Google

Gemini 3 Flash

Chat

O modelo rápido de chat de IA de próxima geração do Google na Rivya. Com custos de token ainda menores que Gemini 2.5 Flash e raciocínio mais forte, ele foi criado para chat multimodal em alto volume, triagem de capturas de tela e trabalho rápido de assistente.

Por que escolher

Menor preço de tokens entre todos os modelos de chat

Melhor para
Triagem multimodal rápida e análise de capturas de tela
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Raciocínio melhorado em relação ao Gemini 2.5 FlashSuporte visual com até 6 imagens

Google

Gemini 2.5 Pro

Chat

O modelo de chat Gemini com IA mais avançado do Google na Rivya. Com raciocínio mais forte que o Flash, suporte visual e contexto de 20K, ele é mais adequado para síntese de pesquisa, análise de documentos e escrita estruturada a 2 créditos.

Por que escolher

Raciocínio mais forte que Gemini Flash

Melhor para
Síntese de pesquisa e textos analíticos
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Suporte visual — analise até 6 imagensCusto equilibrado a 2 créditos por uso

Google

Gemini 2.5 Flash

Chat

O modelo de chat de IA mais rápido e acessível do Google na Rivya. Com 1 crédito por uso e suporte visual para até 6 imagens, ele se encaixa em perguntas e respostas rápidas, resumos iniciais, triagem de capturas de tela e assistência de IA do dia a dia.

Por que escolher

Modelo de chat de menor custo, a 1 crédito

Melhor para
Consultas rápidas de pesquisa e resumos iniciais
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Resposta rápida para conversas em tempo realSuporte visual — analise até 6 imagens

Anthropic

Claude Opus 4.7

Chat

O modelo de chat Claude principal da Anthropic na Rivya para raciocínio profundo, síntese cuidadosa, escrita executiva e trabalho textual de alto impacto.

Por que escolher

Raciocínio textual e síntese em nível principal

Melhor para
Memorandos executivos e narrativas no estilo conselho
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Forte adequação para análise de formato longo e escrita cuidadosaProjeto Claude centrado em texto na interface atual da Rivya

Anthropic

Claude Opus 4.6

Chat

O modelo principal de chat Claude com IA da Anthropic na Rivya. Ele foi criado para raciocínio profundo, análise complexa e escrita de alta qualidade em projetos exigentes e de alta responsabilidade.

Por que escolher

Raciocínio principal e análise complexa

Melhor para
Memorandos executivos e escrita narrativa de alto impacto
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Teto mais alto para compreensão de formato longo e qualidade de saídaProjeto Claude centrado em texto na interface atual da Rivya

Anthropic

Claude Sonnet 4.6

Chat

O modelo de chat Claude com IA equilibrado da Anthropic na Rivya. Ele mantém raciocínio forte de formato longo e análise cuidadosa para projetos de conteúdo, pesquisa e programação sem saltar para o gasto em nível Opus.

Por que escolher

Raciocínio confiável com qualidade equilibrada

Melhor para
Revisar briefings longos, PRDs e documentos de estratégia
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Forte compreensão de formato longo e estabilidade em múltiplas rodadasProjeto Claude centrado em texto na interface atual da Rivya

Anthropic

Claude Opus 4.5

Chat

Modelo principal de chat Claude com IA da Anthropic na Rivya. Ele se destaca em raciocínio profundo, análise complexa e escrita de nível especialista, tornando-se uma escolha premium para tarefas de IA críticas.

Por que escolher

Modelo mais capaz da Anthropic

Melhor para
Síntese de pesquisa profunda e análise difícil
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Raciocínio profundo e análise complexa excepcionaisEscrita de nível especialista e qualidade de conteúdo

Anthropic

Claude Sonnet 4.5

Chat

O modelo de chat Claude com IA equilibrado da Anthropic na Rivya. Ele é forte em escrita sutil, análise cuidadosa e respostas com atenção à segurança, tornando-se uma opção Claude sólida para criação de conteúdo e pesquisa.

Por que escolher

Escrita sutil e análise cuidadosa

Melhor para
Reescritas editoriais e escrita sensível ao tom
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Respostas bem calibradas e com atenção à segurançaProjeto Claude centrado em texto na interface atual da Rivya

Anthropic

Claude Haiku 4.5

Chat

Modelo leve de chat Claude com IA da Anthropic na Rivya. Ele é ajustado para velocidade, eficiência de custo e desempenho estável em chats do dia a dia para projetos de alta frequência em que você quer o tom Claude sem gasto de nível premium.

Por que escolher

Mais adequado para uso de baixa latência e alta frequência

Melhor para
Triagem de caixa de entrada e perguntas internas rápidas
Entrada
Texto
Saída
Texto / raciocínio
Créditos
Pague por uso — créditos baseados no uso
Preço por token muito mais barato que Sonnet ou OpusProjeto Claude centrado em texto na interface atual da Rivya

Alibaba

Z-Image

Imagem

Modelo leve de texto para imagem da Alibaba. Geração rápida de imagem única com 5 proporções, ideal para rascunhos rápidos de conceito e visuais de mídia social por apenas 1 crédito.

Por que escolher

Menor custo, com 1 crédito por geração

Melhor para
Conceitos visuais baratos de primeira passada
Entrada
Texto
Saída
Imagem
Créditos
A partir de 1 crédito por geração
Saída rápida de imagem única para iteração velozTexto para imagem limpo com 5 presets de proporção

Google

Nano Banana 2

Imagem

Modelo de imagem de nova geração do Google com resolução 4K, 15 proporções de tela (incluindo 8:1 extremo), grounding com Google Search e até 14 imagens de referência — o gerador de imagens mais flexível na Rivya.

Por que escolher

Até resolução 4K (1K / 2K / 4K selecionáveis)

Melhor para
Conceitos de imagem em grande formato e layouts panorâmicos
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 5 créditos por geração
15 proporções de tela, incluindo panorâmicas extremas 8:1 e 1:8Grounding com Google Search para contexto do mundo real

Google

Nano Banana Pro

Imagem

Modelo de imagem premium do Google com saída 4K, 11 proporções de tela e até 8 imagens de referência. Otimizado para visuais de marca e campanha de alta fidelidade, com mais detalhe e precisão de cor.

Por que escolher

Até resolução 4K com fidelidade aprimorada

Melhor para
Visuais de marca premium e imagens de marketing de nível mais alto
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 8 créditos por geração
11 proporções de tela com opção de detecção automáticaAté 8 imagens de referência para consistência de marca

Google

Nano Banana

Imagem

Modelo de imagem flexível do Google para texto para imagem e imagem para imagem, com 11 proporções de tela, até 10 imagens de referência e saída PNG/JPEG. Uma opção forte para retratos, composições de produto e visuais mais largos de landing page.

Por que escolher

11 proporções de tela, incluindo 21:9 ultra-wide e modo automático

Melhor para
Composições de produto com várias referências visuais
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 3 créditos por geração
Até 10 imagens de referência para criação guiadaOpções de formato de saída PNG e JPEG

OpenAI

GPT Image 2

Imagem

O modelo GPT Image mais novo da OpenAI na Rivya, com texto para imagem, imagem para imagem, até 16 imagens de referência e níveis claros de créditos para 1K / 2K / 4K.

Por que escolher

Texto para imagem e imagem para imagem em uma única página de modelo na Rivya

Melhor para
Visuais de produto e campanha em alta resolução
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 3 créditos por geração
Níveis de resolução 1K, 2K e 4K para controle de orçamento mais claroAté 16 imagens de referência para briefs estruturados de edição

OpenAI

GPT Image 1.5

Imagem

O modelo de imagem da OpenAI com níveis de qualidade média/alta e até 16 imagens de referência. Ele se destaca em seguir instruções complexas e renderizar cenas coerentes com relações espaciais precisas.

Por que escolher

Até 16 imagens de referência — o maior limite na Rivya

Melhor para
Visuais de produto e campanha com muitas instruções
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 4 créditos por geração
Níveis de qualidade Média e Alta para controle de custoCompreensão superior de prompt a partir do modelo de linguagem da OpenAI

OpenAI

4o Image

Imagem

O modelo 4o Image da OpenAI agora está disponível como um caminho dedicado de texto para imagem na Rivya. Por enquanto, a configuração da página fica propositalmente estreita: prompt mais 3 proporções suportadas, com custo fixo de 3 créditos por imagem.

Por que escolher

Entrada dedicada para OpenAI 4o Image em vez de ficar misturada a outro modelo

Melhor para
Visuais conceituais rápidos a partir de um briefing em texto
Entrada
Texto
Saída
Imagem
Créditos
A partir de 3 créditos por geração
Fluxo de texto para imagem com o caminho listado de 3 créditos por imagemTrês opções documentadas de proporção: 1:1, 3:2 e 2:3

ByteDance

Seedream 5.0 Lite

Imagem

O modelo de imagem Seedream mais leve da ByteDance, com preço compartilhado entre texto para imagem e edição de imagem. Ele oferece suporte a 8 proporções, até 14 imagens de referência e atualmente custa 6 créditos por execução.

Por que escolher

Preço fixo de 6 créditos para texto para imagem e imagem para imagem

Melhor para
Painéis de campanha e direções de mood com muitas referências
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 6 créditos por geração
Até 14 imagens de referência para projetos de edição guiada8 proporções, incluindo ultra-wide 21:9

ByteDance

Seedream 4.5

Imagem

O modelo de imagem high-end da ByteDance, com faixas de qualidade 2K/4K, 8 proporções e até 14 imagens de referência. Conhecido por gradação de cor cinematográfica e detalhes ricos de textura em visuais de moda e lifestyle.

Por que escolher

Faixas de qualidade 2K (Básica) e 4K (Alta) selecionáveis

Melhor para
Imagens de campanha de moda e lifestyle
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 7 créditos por geração
Até 14 imagens de referência para criação guiada8 proporções, incluindo ultra-wide 21:9

ByteDance

Seedream 4.0

Imagem

O Seedream 4.0 é um modelo de imagem equilibrado da ByteDance na Rivya para geração de texto para imagem, edição com imagens de referência e controles explícitos de saída.

Por que escolher

Um único slot de modelo cobre texto para imagem e edição de imagem

Melhor para
Visuais de lifestyle e rascunhos de imagem em estilo editorial
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
6 créditos fixos por geração
Mantém visíveis os controles públicos `image_resolution` e `max_images`Suporta até 10 imagens de referência no caminho de edição

ByteDance

Seedream 3.0

Imagem

O Seedream 3.0 retorna agora como um modelo legado de imagem independente na Rivya. Atualmente, ele mantém apenas o caminho público de texto para imagem e custa 5 créditos por execução.

Por que escolher

Mantém o Seedream 3.0 disponível como uma entrada legada própria de texto para imagem

Melhor para
Equipes que querem preservar uma direção visual mais antiga do Seedream
Entrada
Texto
Saída
Imagem
Créditos
5 créditos fixos por geração
Expõe apenas o subconjunto de parâmetros claramente mostrado na documentação públicaSuperfície de parâmetros mais leve do que nas opções Seedream mais novas

xAI

Grok Imagine

Imagem

Modelo de imagem da xAI com forte interpretação criativa e 5 proporções. Geração de imagem única focada em expressão artística e estilos visuais não convencionais.

Por que escolher

Interpretação criativa e artística forte

Melhor para
Visuais conceituais ousados e direção de arte experimental
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 4 créditos por geração
Estilos visuais únicos, distintos de outros modelosSuporte a texto para imagem e imagem para imagem

Black Forest Labs

Flux 2 Pro

Imagem

O modelo principal de 32B parâmetros da Black Forest Labs. Oferece suporte a texto para imagem e imagem para imagem com até 8 imagens de referência, resolução 2K e renderização precisa de texto — criado para fotos de produto e visuais de marca.

Por que escolher

Até resolução 2K com texturas fotorrealistas

Melhor para
Fotos estáticas de produto e imagens principais de ecommerce
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 5 créditos por geração
Renderização precisa de texto e logotipos em imagensAté 8 imagens de referência para consistência de estilo/personagem

Black Forest Labs

Flux 2 Flex

Imagem

Variante da família Flux 2 focada em edição. Especializa-se em ajustes estruturais e transferência de estilo com até 8 imagens de referência e resolução 2K — ideal para iterar sobre visuais existentes.

Por que escolher

Otimizado para edição de imagem e transferência de estilo

Melhor para
Editar uma imagem existente de campanha ou produto
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 14 créditos por geração
Até 8 imagens de referência para edições guiadasSaída em resolução 2K com qualidade Flux 2

Black Forest Labs

Flux Kontext Max

Imagem

O modelo Flux Kontext aprimorado da Black Forest Labs para tarefas mais exigentes de geração guiada por prompt e edição de imagem. A Rivya atualmente mantém texto para imagem e imagem para imagem no mesmo projeto assíncrono e precifica ambos em 8 créditos fixos por geração sob a política atual da plataforma.

Por que escolher

Preço fixo de 8 créditos para geração e edição na Rivya

Melhor para
Refinamentos de visual principal em uma imagem importante de campanha
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 8 créditos por geração
Nível Kontext mais avançado para prompts ou tarefas de edição mais difíceisProjeto de um só modelo para texto para imagem e edição de uma imagem

Black Forest Labs

Flux Kontext Pro

Imagem

O projeto Flux Kontext de menor custo da Black Forest Labs para texto para imagem e edição de uma única imagem. A Rivya atualmente expõe texto para imagem e imagem para imagem no mesmo projeto assíncrono de imagem, com preço fixo de 4 créditos para ambos os modos sob a política atual de preços da plataforma.

Por que escolher

Preço fixo de 4 créditos para geração e edição na Rivya

Melhor para
Variantes de anúncio e social a partir de uma imagem de origem aprovada
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 4 créditos por geração
Projeto de um só modelo para texto para imagem e edição de uma imagemAlternância de tradução integrada para o requisito de prompt somente em inglês

Alibaba

Qwen2 Image

Imagem

O modelo de imagem Qwen2 da Alibaba está atualmente integrado na Rivya como um projeto de imagem de preço fixo. Ele cobre com segurança texto para imagem e imagem para imagem com o subconjunto compartilhado de proporções que ambas as documentações públicas expõem, além de saída PNG/JPEG, reutilização de seed e um switch NSFW simples.

Por que escolher

Preço fixo de 6 créditos para texto para imagem e imagem para imagem

Melhor para
Pôsteres e visuais de campanha em chinês
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 6 créditos por geração
Usa `qwen2/text-to-image` em execuções por texto e `qwen2/image-edit` em execuções com imagem de referênciaSubconjunto seguro de proporções compartilhado entre as duas documentações públicas do Qwen2

Alibaba

Qwen Image

Imagem

Modelo de imagem da família Alibaba Qwen com presets HD (Square, Portrait, Landscape) e saída PNG/JPEG. Forte em prompts em chinês e geração visual com nuances culturais.

Por que escolher

Tamanhos HD predefinidos: Square, Portrait 4:3/16:9, Landscape 4:3/16:9

Melhor para
Visuais de marketing em chinês
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 4 créditos por geração
Forte compreensão de prompts em chinêsOpções de formato de saída PNG e JPEG

Midjourney

Midjourney

Imagem

Modelo de imagem V7 da Midjourney para texto para imagem e imagem para imagem, com modos anime Niji, 3 níveis de velocidade (Relaxed/Fast/Turbo), referências de estilo e consistência guiada por Omni Reference. Ainda é o benchmark para arte cinematográfica, ilustrações e moodboards.

Por que escolher

Qualidade estética incomparável — o benchmark do setor

Melhor para
Arte conceitual cinematográfica e moodboards
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 3 créditos por geração
V7 + V6.1 + V6 + modos anime Niji 7/63 níveis de velocidade: Relaxed, Fast, Turbo

Recraft

Recraft Remove Background

Imagem

Modelo de remoção de fundo da Recraft na Rivya para isolar o sujeito de uma imagem existente. Use quando a próxima etapa precisa de um asset transparente, um recorte limpo ou uma imagem-fonte sem o fundo original.

Por que escolher

Ferramenta de recorte de finalidade única com preço fixo de 1 crédito

Melhor para
Remover o fundo de uma imagem de produto, retrato ou catálogo antes do trabalho de design
Entrada
Referência / Imagem
Saída
Imagem
Créditos
A partir de 1 crédito por geração
Construída para uma imagem enviada e geralmente não precisa de promptForte encaixe para fotos de produto, retratos e outros assets com bordas de sujeito legíveis

Recraft

Recraft Crisp Upscale

Imagem

Modelo leve de upscale de imagem da Recraft na Rivya para aumentar nitidez e clareza a baixo custo em uma imagem estática já aprovada. Use quando a imagem escolhida só precisa de uma passada barata de polimento antes da exportação, não de um upscale mais pesado em nível de entrega.

Por que escolher

Passada fixa de limpeza por 1 crédito para uma imagem enviada

Melhor para
Dar a uma miniatura, arte social ou imagem pequena de produto um ganho rápido de clareza
Entrada
Referência / Imagem
Saída
Imagem
Créditos
A partir de 1 crédito por geração
Bom para nitidez rápida e ampliação leve antes de publicar ou entregarNão exige prompt e não tem escala de tamanhos para gerenciar, então continua útil como pré-checagem de baixo atrito

Alibaba

Wan 2.7 Image Pro

Imagem

Modelo de imagem Wan 2.7 mais avançado da Alibaba, atualmente exposto na Rivya como um slot de imagem separado para texto para imagem e edição de imagem. O preço permanece fixo em 12 créditos por execução ao manter explicitamente a geração em uma única imagem de saída.

Por que escolher

Preço fixo de 12 créditos para texto para imagem e imagem para imagem

Melhor para
Visuais-chave de marca e stills de campanha de lançamento
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 12 créditos por geração
Até 9 imagens de referência para projetos de edição guiadaFamília de imagem Wan 2.7 compartilhada com uma faixa premium mais clara

Alibaba

Wan 2.7 Image

Imagem

O modelo de imagem Wan 2.7 padrão da Alibaba aparece na Rivya como seu próprio slot de imagem para texto para imagem e edição de imagem, e atualmente custa 5 créditos por execução.

Por que escolher

Atualmente custa 5 créditos por execução

Melhor para
Quadros de rascunho sociais e de campanha com múltiplas referências
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 5 créditos por geração
Suporta texto para imagem e imagem para imagemAté 9 imagens de referência para edições guiadas

Google

Google Imagen4 Ultra

Imagem

Google Imagen4 Ultra é a camada premium de texto para imagem Imagen da Rivya. Atualmente ele está integrado como um projeto de imagem única, com preço fixo de 12 créditos e controles públicos de prompt, prompt negativo, proporção e semente.

Por que escolher

Preço fixo de 12 créditos na Rivya

Melhor para
Arte principal de homepage e visuais premium de campanha
Entrada
Texto
Saída
Imagem
Créditos
A partir de 12 créditos por geração
Nível premium de texto para imagem Google ImagenControles de prompt negativo, proporção e semente

Google

Google Imagen4

Imagem

Google Imagen4 é a camada padrão de texto para imagem Imagen da Rivya. Atualmente ele está integrado como um projeto de imagem única, com preço fixo de 8 créditos e controles públicos de prompt, prompt negativo, proporção e semente.

Por que escolher

Preço fixo de 8 créditos na Rivya

Melhor para
Gráficos principais de site e ilustrações editoriais
Entrada
Texto
Saída
Imagem
Créditos
A partir de 8 créditos por geração
Nível padrão de texto para imagem Google ImagenControles de prompt negativo, proporção e semente

Google

Google Imagen4 Fast

Imagem

Google Imagen4 Fast é o nível leve de texto para imagem Imagen da Rivya. Atualmente ele mantém um projeto de imagem única, usa preço fixo de 4 créditos e expõe controles públicos de prompt, prompt negativo, proporção e semente sem abrir saída com múltiplas imagens.

Por que escolher

Preço fixo de 4 créditos na Rivya

Melhor para
Direções visuais rápidas para páginas de destino ou blog
Entrada
Texto
Saída
Imagem
Créditos
A partir de 4 créditos por geração
Entrada leve de texto para imagem Google ImagenControles de prompt negativo, proporção e semente

Topaz

Topaz Image Upscaler

Imagem

O upscaler de imagem em nível de entrega da Topaz na Rivya para imagens estáticas aprovadas que precisam de um salto real de tamanho. Use quando a composição já estiver final e o problema restante for resolução de exportação, tamanho de revisão ou prontidão para impressão.

Por que escolher

Feito para imagens estáticas aprovadas que precisam de um salto real no tamanho de entrega, não de uma composição regenerada

Melhor para
Ampliar imagens aprovadas de ecommerce, produto ou campanha para formatos maiores de entrega
Entrada
Referência / Imagem
Saída
Imagem
Créditos
A partir de 5 créditos por execução
Escada explícita de UI baseada nos fatores 1, 2, 4 e 8 facilita escolher o equilíbrio entre tamanho e custoMais adequado que Recraft Crisp Upscale quando a imagem escolhida já está final e o tamanho de saída realmente importa

Ideogram

Ideogram V3

Imagem

Ideogram V3 é o modelo de texto para imagem da Rivya para renderização de texto, layouts de pôster e prompts de imagem com foco em design. O preço atual é 4 créditos para TURBO, 7 para BALANCED e 10 para QUALITY.

Por que escolher

Faixas de velocidade de renderização: TURBO, BALANCED, QUALITY

Melhor para
Conceitos de pôster e gráficos publicitários guiados por título
Entrada
Texto
Saída
Imagem
Créditos
A partir de 4 créditos por geração
Geração de imagens Ideogram V3 orientada a designAlternância de expansão MagicPrompt

Ideogram

Ideogram V3 Reframe

Imagem

Ideogram V3 Reframe está atualmente integrado à Rivya como um projeto de reenquadramento de imagem única com preço por velocidade de renderização. O preço atual é 4 créditos para TURBO, 7 para BALANCED e 10 para QUALITY.

Por que escolher

Faixas de velocidade de renderização: TURBO, BALANCED, QUALITY

Melhor para
Adaptar um visual aprovado a novas proporções
Entrada
Referência / Imagem
Saída
Imagem
Créditos
A partir de 4 créditos por geração
Projeto de reenquadramento de imagem únicaPrompt opcional para este modelo

Ideogram

Ideogram V3 Remix

Imagem

Ideogram V3 Remix está atualmente integrado à Rivya como um projeto de remix de imagem única com preço por velocidade de renderização. O preço atual é 4 créditos para TURBO, 7 para BALANCED e 10 para QUALITY.

Por que escolher

Faixas de velocidade de renderização: TURBO, BALANCED, QUALITY

Melhor para
Direções de arte alternativas a partir de uma imagem de origem
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 4 créditos por geração
Projeto de remix de imagem únicaControles de MagicPrompt, força e prompt negativo

Ideogram

Ideogram Character

Imagem

Opção de consistência de personagem para transformar uma imagem de personagem aprovada em novas cenas, roupas e formatos. Escolha quando a preservação da identidade importa mais do que edição ampla de imagem e você só precisa de uma imagem de saída por vez.

Por que escolher

Projeto com uma única referência ajustado para manter um personagem reconhecível em novas cenas

Melhor para
Manter um mascote, avatar ou personagem ilustrado reconhecível em muitas cenas novas
Entrada
Texto / Referência / Imagem
Saída
Imagem
Créditos
A partir de 12 créditos por geração
Separado de Ideogram V3, Reframe e Remix para que usuários escolham consistência em vez de liberdade ampla de ediçãoSaída previsível de uma imagem com faixas de crédito TURBO, BALANCED e QUALITY

ByteDance

Seedance 2.0

Vídeo

O modelo de vídeo Seedance 2.0 completo da ByteDance, com suporte explícito a geração apenas por prompt, animação guiada por quadros e geração com referência multimodal. A Rivya mantém explícita a divisão de papéis documentada para que entradas de quadros e referências multimodais permaneçam mutuamente exclusivas, em vez de virarem um único campo ambíguo de upload.

Por que escolher

Divisão completa de cenas do Seedance 2.0: texto, quadros e referência multimodal

Melhor para
Vídeos curtos de maior qualidade a partir de prompts, quadros ou pacotes de referência
Entrada
Texto
Saída
Vídeo
Créditos
A partir de 64 créditos por execução
Projetos guiados por prompt, guiados por quadros e com referência multimodal em um único modeloSaída em 480p e 720p com suporte a proporção adaptativa

ByteDance

Seedance 2.0 Fast

Vídeo

O modelo de vídeo Seedance 2.0 mais rápido da ByteDance, com roteamento completo de cenas para geração apenas por prompt, animação de imagem guiada por quadros e geração de vídeo com referência multimodal. A Rivya mantém explícita a divisão de cenas documentada para que entradas de primeiro/último quadro não entrem em conflito com papéis de imagem, vídeo e áudio de referência.

Por que escolher

Divisão completa de cenas do Seedance 2.0 Fast: texto, quadros e referência multimodal

Melhor para
Pré-visualização rápida de anúncios a partir de prompts ou quadros de storyboard
Entrada
Texto
Saída
Vídeo
Créditos
A partir de 52 créditos por execução
Saída em 480p e 720p com suporte a proporção adaptativaGeração opcional de áudio sincronizado e retorno do quadro final

ByteDance

Seedance 1.5 Pro

Vídeo

O modelo de vídeo flagship da ByteDance para texto para vídeo e imagem para vídeo, com sincronização nativa entre áudio e imagem. Clipes de 480p a 1080p, 4 a 12s, 6 proporções, controle de lente dinâmica ou fixa, geração de áudio opcional e suporte a lip sync.

Por que escolher

Sincronização nativa entre áudio e imagem com lip sync preciso

Melhor para
Clipes curtos com diálogo e movimento sincronizados
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
A partir de 28 créditos por geração
Opções de resolução em 480p / 720p / 1080pDuração configurável de clipe em 4s, 8s ou 12s

ByteDance

Seedance 1.0 Pro

Vídeo

O modelo Seedance 1.0 Pro da ByteDance, disponibilizado na Rivya como a opção 1.0 Pro padrão para texto para vídeo e imagem para vídeo. Ele mantém a configuração atual da página alinhada à documentação pública do V1 Pro, com controles de resolução, duração, câmera fixa, seed e verificação de segurança.

Por que escolher

Compatível com texto para vídeo e imagem para vídeo

Melhor para
Clipes cinematográficos curtos
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
A partir de 25 créditos por geração
Níveis de saída em 480p, 720p e 1080pControles de duração de 5s e 10s

ByteDance

Seedance 1.0 Pro Fast

Vídeo

Modelo rápido de imagem para vídeo da ByteDance. Anima uma única imagem de referência em clipes de 5s ou 10s em 720p/1080p — otimizado para velocidade quando você precisa de vídeo rápido a partir de uma imagem estática.

Por que escolher

Especialista em imagem para vídeo — retorno rápido

Melhor para
Animação rápida de imagem estática para vídeo
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
16-72 créditos por geração
Opções de resolução 720p e 1080pDuração de clipe de 5s ou 10s

ByteDance

Seedance 1.0 Lite

Vídeo

O modelo Seedance 1.0 Lite da ByteDance é exposto na Rivya como a opção 1.0 mais leve para texto para vídeo e imagem para vídeo. Ele segue o conjunto público de parâmetros V1 Lite e atualmente usa uma escala de preço menor do que Seedance 1.0 Pro.

Por que escolher

Suporta texto para vídeo e imagem para vídeo

Melhor para
Testes de storyboard de menor custo
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
A partir de 16 créditos por geração
Preço menor do que Seedance 1.0 ProSegunda imagem opcional como frame final no modo imagem para vídeo

HappyHorse

HappyHorse 1.0

Vídeo

Um modelo flexível de vídeo com IA na Rivya para texto para vídeo, movimento a partir de uma única imagem, vídeo com referência de múltiplas imagens e edição de vídeo em uma página pública de modelo.

Por que escolher

Uma página de modelo cobre fluxos de texto, imagem, referência e edição de vídeo

Melhor para
Rascunhos curtos de movimento para anúncio ou produto a partir de um briefing escrito
Entrada
Texto / Referência / Imagem / Vídeo
Saída
Vídeo
Créditos
A partir de 28 créditos por geração
Suporte a faixas de saída 720p e 1080p com preço fixoAceita até 9 referências de imagem quando nenhum vídeo é anexado

Alibaba

Wan 2.7 Video

Vídeo

Linha de vídeo Wan mais nova da Alibaba com preço por resolução e duração. A Rivya expõe texto para vídeo, imagem para vídeo e edição de vídeo em um único slot de modelo, a partir de 80 créditos por geração.

Por que escolher

Preço por resolução e duração: 720p = 16 créditos/s, 1080p = 24 créditos/s

Melhor para
Promos de produto e cortes sociais com orçamento controlado
Entrada
Texto / Referência / Imagem / Vídeo
Saída
Vídeo
Créditos
A partir de 80 créditos por geração
Suporta texto para vídeo, imagem para vídeo e edição de vídeo em um único slot de modeloImagem para vídeo pode usar uma imagem ou um par de primeira e última imagem

Alibaba

Wan 2.6

Vídeo

Opção Wan de três modos da Alibaba na Rivya: texto para vídeo, imagem para vídeo e edição de vídeo de origem em um único projeto. Suporta 720p/1080p, clipes de 5 a 15 segundos e uma imagem ou um vídeo de origem por vez.

Por que escolher

Modo triplo: texto para vídeo + imagem para vídeo + vídeo para vídeo

Melhor para
Edições vídeo para vídeo a partir de um clipe de origem existente
Entrada
Texto / Referência / Imagem / Vídeo
Saída
Vídeo
Créditos
A partir de 70 créditos por geração
Uma opção Wan pesada que pode começar de um vídeo de origem em vez de apenas texto ou imagens estáticasUma imagem ou um vídeo de origem mantém o caminho de edição explícito

Alibaba

Wan 2.5 Video

Vídeo

Wan 2.5 agora aparece na Rivya como uma entrada compartilhada para texto para vídeo e imagem para vídeo. O preço atual é `720p_5 = 60`, `720p_10 = 120`, `1080p_5 = 100` e `1080p_10 = 200` créditos.

Por que escolher

Um único slot de modelo para texto para vídeo e imagem para vídeo

Melhor para
Clipes promocionais Wan de 5 ou 10 segundos a partir de texto ou uma imagem principal
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
A partir de 60 créditos por geração
Precificação comercial atualmente fixa em quatro faixas de resolução e duraçãoMantém a cadeia assíncrona existente de resultado de vídeo sem um novo tipo de resultado

Alibaba

Wan 2.2 A14B Turbo

Vídeo

Wan 2.2 A14B Turbo agora cobre texto para vídeo, imagem para vídeo e também um caminho de vídeo guiado por imagem e áudio na Rivya. O preço atual é `480p = 8` e `720p = 12` para execuções por texto ou imagem, além de `480p = 16`, `580p = 20` e `720p = 24` quando uma imagem e um clipe de áudio conduzem o resultado.

Por que escolher

Um único slot de modelo agora cobre geração de vídeo por texto, imagem e imagem mais áudio

Melhor para
Experimentos mais leves de texto para vídeo no Wan
Entrada
Texto / Referência / Imagem / Áudio
Saída
Vídeo
Créditos
A partir de 8 créditos por geração
A precificação comercial continua em faixas entre execuções mais leves por texto/imagem e execuções mais pesadas guiadas por imagem mais áudioO caminho guiado por imagem mais áudio mantém seu próprio subconjunto de parâmetros avançados em vez de reduzir tudo a padrões

Alibaba

Wan Animate Replace

Vídeo

Modelo de vídeo da Wan para substituição de personagem na Rivya, usado para trocar quem aparece em um clipe existente. Use uma URL pública de vídeo de origem, uma URL pública de imagem de substituição e uma faixa de resolução quando o movimento já está correto e o sujeito visível precisa mudar.

Por que escolher

Mantém o formato público `video_url + image_url + resolution` em vez de inventar um projeto pesado em prompt

Melhor para
Substituir o sujeito ou personagem na tela mantendo o movimento do clipe de origem
Entrada
Vídeo
Saída
Vídeo
Créditos
A partir de 12 créditos por geração
Mais indicado para trocas de sujeito ou personagem em que o movimento original deve permanecer intactoFunciona bem quando os dois assets já estão em armazenamento público e podem ser buscados pelo serviço upstream

MiniMax

Hailuo 2.3

Vídeo

Modelo de imagem para vídeo da MiniMax com faixas de qualidade Standard/Pro, resolução 768P/1080P e clipes de 6s ou 10s. Conhecido por movimentos mais suaves e transições naturais a partir de imagens estáticas.

Por que escolher

Faixas de qualidade Standard e Pro

Melhor para
Animar retratos ou imagens de moda em movimento
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
A partir de 25 créditos por geração
Opções de resolução 768P e 1080PDuração de clipe configurável em 6s ou 10s

MiniMax

Hailuo Pro

Vídeo

O modelo de vídeo Hailuo Pro mais antigo da MiniMax está conectado aqui como um modelo fixo de faixa Pro para texto para vídeo e imagem para vídeo. O modo de imagem aceita 1 ou 2 imagens de referência, com a segunda imagem usada como último quadro, e cada geração atualmente custa 57 créditos.

Por que escolher

Um modelo para texto para vídeo e imagem para vídeo

Melhor para
Rascunhos de movimento de maior qualidade a partir de um visual-chave
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
57 créditos por geração
Modo de imagem com suporte a primeiro quadro ou par de primeiro e último quadroConectado na faixa Pro fixa confirmada publicamente

MiniMax

Hailuo Standard

Vídeo

Modelo de vídeo Hailuo Standard mais antigo da MiniMax, unificado aqui como um modelo para texto para vídeo e imagem para vídeo. O modo de imagem aceita 1 ou 2 imagens de referência, com a segunda imagem usada como último quadro, e as faixas públicas de preço atualmente verificadas vão de 12 a 50 créditos.

Por que escolher

Um modelo para texto para vídeo e imagem para vídeo

Melhor para
Transformar uma imagem principal em uma prévia curta com movimento
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
12-50 créditos por geração
Modo de imagem com suporte a primeiro quadro ou par de primeiro e último quadroFaixas guiadas por imagem em 512P e 768P

Kuaishou

Kling 3.0

Vídeo

Modelo de vídeo premium da Kuaishou para texto para vídeo e imagem para vídeo, com níveis Standard (720P) / Pro (1080P), estrutura de tomada única ou múltiplas tomadas, duração de 3 a 15 s, geração de áudio opcional e até 2 imagens de referência.

Por que escolher

Níveis de qualidade Standard (720P) e Pro (1080P)

Melhor para
Pré-visualização de anúncios em estilo storyboard com planejamento explícito de tomadas
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
A partir de 42 créditos por geração
Modos de geração com tomada única ou múltiplas tomadasDuração flexível de clipe entre 3 e 15 segundos

Kuaishou

Kling 3.0 motion-control

Vídeo

Opção Kling motion-control mais nova para conduzir um sujeito a partir de uma imagem de referência e um vídeo de movimento, com escolha explícita de fonte do fundo. Escolha quando quiser transferência de movimento e mais controle sobre se a cena deve vir do vídeo ou da imagem.

Por que escolher

Projeto exato de 1 imagem + 1 vídeo de movimento mantém claros os papéis de identidade e movimento

Melhor para
Execuções de transferência de movimento em que você precisa escolher se o fundo vem do vídeo de movimento ou da imagem de referência
Entrada
Texto / Referência / Imagem / Vídeo
Saída
Vídeo
Créditos
A partir de 20 créditos por geração
Adiciona `background_source` sobre a orientação do personagem, que é o principal upgrade em relação ao Kling 2.6 motion-controlPreço fixo Standard (720P) e Pro (1080P) em 20 / 27 créditos

Kuaishou

Kling 2.6

Vídeo

Modelo de vídeo da Kuaishou com geração de áudio opcional, clipes de 5s/10s e 3 proporções. Forte em movimento humano e animação expressiva de personagens com física natural.

Por que escolher

Geração de áudio opcional junto com vídeo

Melhor para
Performance de personagem e movimento expressivo
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
A partir de 55 créditos por geração
Duração de clipe de 5s ou 10s3 proporções: 1:1, 16:9, 9:16

Kuaishou

Kling 2.6 motion-control

Vídeo

Projeto dedicado de transferência de movimento para conduzir um sujeito a partir de uma imagem de referência e um vídeo de movimento. Escolha quando quiser uma execução Kling motion-control mais barata e puder abrir mão dos controles extras de cena do Kling 3.0 motion-control.

Por que escolher

Projeto exato de 1 imagem + 1 vídeo de movimento, deixando claro o que guia a identidade e o que guia o movimento

Melhor para
Conduzir um personagem a partir de uma imagem estática e um clipe separado de referência de movimento
Entrada
Texto / Referência / Imagem / Vídeo
Saída
Vídeo
Créditos
A partir de 16 créditos por geração
Ponto de entrada mais barato que Kling 3.0 motion-control, em 16 / 22 créditosPrompt opcional permite que o clipe de movimento enviado continue sendo o guia principal

Kuaishou

Kling V2.5 Turbo Pro

Vídeo

Modelo de vídeo Kling V2.5 Turbo Pro, da Kuaishou, agora com suporte a texto para vídeo e imagem para vídeo. A evidência pública de preço cobre claramente os níveis de texto e imagem em 5 segundos e 10 segundos, então a Rivya o mapeia diretamente para 42 / 84 créditos.

Por que escolher

Evidência pública clara de preço para níveis de texto e imagem

Melhor para
Previs de anúncios curtos a partir de texto ou de frames inicial e final
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
42-84 créditos por geração
Geração por texto e imagem compartilham uma entrada de modelo alinhadaModo de imagem suporta primeiro frame mais um frame final opcional

Kuaishou

Kling V2.1 Master

Vídeo

O modelo de vídeo legado Kling V2.1 Master, da Kuaishou, agora oferece suporte a texto para vídeo e imagem para vídeo na Rivya. O preço atual é de 160 créditos para 5 segundos e 320 créditos para 10 segundos.

Por que escolher

Níveis de preço fixos para 5 segundos e 10 segundos

Melhor para
Comparações do Kling Master legado contra níveis mais novos
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
160-320 créditos por geração
Geração por texto e imagem agora compartilham uma entrada de modelo alinhadaTexto mantém `aspect_ratio`, enquanto imagem fica apenas nos campos respaldados pela documentação

Kuaishou

Kling V2.1 Pro

Vídeo

O modelo legado de imagem para vídeo Kling V2.1 Pro, da Kuaishou, oferece suporte a um primeiro frame e uma imagem opcional de frame final. O preço atual é de 50 créditos para 5 segundos e 100 créditos para 10 segundos.

Por que escolher

Somente imagem para vídeo, com projeto mais estreito

Melhor para
Testes de tomadas antes e depois, ou com frame inicial e final
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
50-100 créditos por geração
Suporta um primeiro frame e um frame final opcionalNíveis de preço fixos para 5 segundos e 10 segundos

Kuaishou

Kling V2.1 Standard

Vídeo

Modelo legado de imagem para vídeo Kling V2.1 Standard, da Kuaishou. O preço atual é de 25 créditos para 5 segundos e 50 créditos para 10 segundos.

Por que escolher

Somente imagem para vídeo

Melhor para
Animar uma imagem estática de produto em um teste rápido de movimento
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
25-50 créditos por geração
Níveis de preço fixos para 5 segundos e 10 segundosSuporta `negative_prompt` e `cfg_scale`

Kuaishou

Kling AI Avatar Pro

Vídeo

Modelo de avatar falante Kling AI Avatar Pro, de qualidade mais alta, da Kuaishou, que usa uma imagem de retrato e um clipe de áudio para gerar vídeo de avatar com sincronização labial. A Rivya atualmente cobra um preço fixo de 16 créditos por geração.

Por que escolher

Projeto fixo de avatar falante de alta qualidade com retrato mais áudio

Melhor para
Vídeos de avatar falante com qualidade mais alta
Entrada
Texto / Referência / Imagem / Áudio
Saída
Vídeo
Créditos
16 créditos por geração
Preço fixo de 16 créditos na RivyaMelhor encaixe para saída de sincronização labial com prioridade em qualidade

Kuaishou

Kling AI Avatar Standard

Vídeo

Modelo de avatar falante Kling AI Avatar Standard, da Kuaishou, que usa uma imagem de retrato e um clipe de áudio para gerar vídeo de avatar com sincronização labial. A Rivya atualmente cobra um preço fixo de 8 créditos por geração.

Por que escolher

Projeto fixo de avatar falante com retrato mais áudio

Melhor para
Vídeos de avatar falante
Entrada
Texto / Referência / Imagem / Áudio
Saída
Vídeo
Créditos
8 créditos por geração
Preço fixo de 8 créditos na RivyaCaminho direto para sincronização labial

MeiGen-AI

Infinitalk

Vídeo

Infinitalk é um modelo de vídeo falado com retrato e áudio. O preço atual é medido por resolução e duração do áudio: 480p = 3 créditos por segundo e 720p = 12 créditos por segundo.

Por que escolher

Projeto fixo de vídeo falado com retrato e áudio

Melhor para
Vídeos com avatar falante
Entrada
Texto / Referência / Imagem / Áudio
Saída
Vídeo
Créditos
3 ou 12 créditos por segundo
Créditos seguem resolução e duração verificada do áudioSuporte a faixas de saída 480p e 720p

Runway

Runway

Vídeo

Runway é um modelo de vídeo independente que oferece suporte a texto para vídeo e imagem para vídeo. A evidência pública de preço atualmente confirma apenas 6 níveis de geração, então a Rivya mantém no conjunto verificado: `720p_5 = 12`, `720p_10 = 30` e `1080p_5 = 30`.

Por que escolher

Evidência pública clara de preço para níveis de texto e imagem

Melhor para
Teasers de lançamento de 5 segundos e anúncios sociais
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
12-30 créditos por geração
Geração por texto e imagem compartilham uma entrada de modelo alinhadaModo de texto mantém `aspectRatio`, enquanto modo de imagem segue a proporção da imagem-fonte

Runway

Runway Aleph

Vídeo

Projeto de transformação de vídeo-fonte para retrabalhar um clipe existente em um novo resultado visual. Use Aleph quando o movimento vem do seu material de entrada e a direção criativa vem do seu prompt, com preço fixo de 90 créditos.

Por que escolher

Construído em torno de um vídeo-fonte, então a base de movimento vem do seu material em vez de uma geração em branco

Melhor para
Retrabalhar um clipe-fonte aprovado em outra direção de arte ou clima
Entrada
Texto / Referência / Vídeo / Imagem
Saída
Vídeo
Créditos
90 créditos por geração
Transformação guiada por prompt com uma imagem de referência opcional para orientar estilo ou sujeitoMantém Aleph separado da geração Runway padrão de 5 ou 10 segundos por texto/imagem

Luma

Luma Modify Video

Vídeo

Projeto independente de reescrita de vídeo-fonte para empurrar um clipe existente em uma nova direção visual. Use quando o prompt deve transformar o próprio material, não apenas deixar a exportação mais nítida.

Por que escolher

Feito especificamente para reescrita de vídeo-fonte, não para simples melhoria

Melhor para
Transformar um clipe-fonte aprovado em outro clima, estilo ou direção de arte
Entrada
Referência / Vídeo
Saída
Vídeo
Créditos
30 créditos por geração
Funciona melhor em clipes curtos com um objetivo de reescrita e um prompt inicialmente em inglêsMelhor encaixe do que upscalers quando o visual, a atmosfera ou a direção de arte devem mudar

xAI

Grok Imagine Video

Vídeo

Modelo de vídeo da xAI com modos criativos Fun/Normal/Spicy e 5 proporções. Predefinições de estilo únicas para diferentes tons criativos, do divertido ao cinematográfico e mais ousado.

Por que escolher

Modos criativos Fun / Normal / Spicy únicos

Melhor para
Clipes de prévia estilizados e movimento pensado para redes sociais
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
A partir de 10 créditos por geração
Saídas em 480p e 720p com cobrança por segundoClipes de 6 a 30 segundos

OpenAI

Sora 2 Pro

Vídeo

A faixa premium do Sora 2, com modos de qualidade Standard/High, clipes de 10s/15s e remoção de marca d'água. Maior detalhe, iluminação e fidelidade de movimento para produção profissional de vídeo.

Por que escolher

Faixas de qualidade Standard e High para uso em produção

Melhor para
Filmes de produto premium e clipes de lançamento
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
A partir de 75 créditos por geração
Detalhe, iluminação e fidelidade de movimento aprimoradosClipes de 10s ou 15s com suporte a prompts de 10K caracteres

OpenAI

Sora 2

Vídeo

O modelo de vídeo da OpenAI para texto para vídeo e imagem para vídeo, com simulação realista do mundo, áudio sincronizado, clipes de 10s/15s, saídas em paisagem/retrato e remoção opcional de marca d'água.

Por que escolher

Simulação do mundo fisicamente precisa

Melhor para
Teasers curtos cinematográficos de produto ou lançamento
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
A partir de 6 créditos por geração
Duração de clipe de 10s ou 15s com suporte a prompt longo (10K caracteres)Opções de orientação em paisagem e retrato

OpenAI

Sora Watermark Remover

Vídeo

O modelo de pós-processamento da Rivya para remoção de marca d'água do Sora em links públicos de compartilhamento Sora já finalizados. Use depois que o vídeo já estiver pronto, quando a tarefa restante for remover a marca d'água e escolher entrega em S3 ou OSS.

Por que escolher

Criado especificamente para links públicos de compartilhamento `sora.chatgpt.com`, não para vídeos genéricos enviados

Melhor para
Remover a marca d'água de um link público de compartilhamento Sora antes da entrega
Entrada
Vídeo
Saída
Vídeo
Créditos
3 créditos por execução
Mantém a remoção de marca d'água separada da geração com Sora 2 e Sora 2 ProApenas duas decisões na Rivya: a URL pública do vídeo e o destino de armazenamento da saída

Topaz

Topaz Video Upscaler

Vídeo

O upscaler de vídeo em nível de entrega da Topaz na Rivya para clipes aprovados que só precisam de mais nitidez na exportação. Use quando a tomada, o movimento e o timing já estiverem certos e o problema restante for resolução ou nitidez do arquivo final.

Por que escolher

Melhor para clipes já aprovados em que só falta nitidez ou resolução de entrega

Melhor para
Aumentar a nitidez de um clipe aprovado antes de entrega ao cliente, apresentação ou publicação
Entrada
Referência / Vídeo
Saída
Vídeo
Créditos
12 créditos por execução
Projeto de vídeo único, sem prompt, que funciona como etapa final de pós-ediçãoEscada simples de 1x, 2x e 4x com a faixa fixa atual de 12 créditos

Google

Veo3.1 Quality

Vídeo

A variante do Google Veo 3.1 voltada primeiro para qualidade em geração premium de texto para vídeo e guiada por imagem. Visuais com maior fidelidade, realismo de movimento mais forte e áudio de fundo por padrão fazem dela a opção Veo mais avançada da Rivya.

Por que escolher

Caminho de saída Veo mais avançado na Rivya

Melhor para
Filmes principais de lançamento e spots premium de marca
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
A partir de 150 créditos por geração
Melhor opção para spots premium de marca e cenas principaisÁudio de fundo incluído por padrão

Google

Veo3.1 Fast

Vídeo

A variante rápida do Google Veo 3.1 com suporte a três modos: texto para vídeo, imagem para vídeo e referência para vídeo. Até 3 imagens de referência, áudio nativo e controles de proporção sensíveis ao modo tornam a opção útil para clipes cinematográficos rápidos.

Por que escolher

Três modos: texto / imagem / referência para vídeo

Melhor para
Conceitos rápidos de anúncio com áudio nativo
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
A partir de 20 créditos por geração
Até 3 imagens de referência para geração guiadaGeração de áudio nativo com vídeo

Google

Veo3.1 Lite

Vídeo

A variante de menor custo do Google Veo 3.1. A Rivya atualmente expõe apenas o menor subconjunto estável: texto para vídeo e imagem para vídeo a um custo fixo de `10` créditos por geração.

Por que escolher

Preço fixo de 10 créditos para texto para vídeo e imagem para vídeo na Rivya

Melhor para
Experimentos Veo de baixo custo antes de pagar por faixas superiores
Entrada
Texto / Referência / Imagem
Saída
Vídeo
Créditos
10 créditos / geração
Mantém o fluxo base de geração Veo 3.1 na menor faixa de custo atualSuporta geração apenas por prompt e geração guiada por imagem

Suno

Suno Music

Áudio

Suno Music é o modelo de texto para música da Rivya para transformar um briefing curto em um primeiro rascunho de música, com ou sem vocais. Ele mantém o ponto de entrada fixo de `12` créditos e expõe `Extend Music` como a próxima etapa depois de uma faixa bem-sucedida.

Por que escolher

Preço fixo documentado de 12 créditos por geração

Melhor para
Testar a direção de uma música antes de entrar em um fluxo de produção mais longo
Entrada
Texto
Saída
Áudio
Créditos
12 créditos / geração
A primeira versão permanece estreita em vez de expor toda a família Suno de uma vezFaixas bem-sucedidas podem continuar por uma ação Extend Music

Suno

Suno Sounds

Áudio

Suno Sounds é o modelo leve de texto para som da Rivya para loops de ambiência, som de fundo e esboços sonoros curtos. Ele mantém o preço fixo documentado de `3` créditos por geração e permite que resultados bem-sucedidos continuem para `Vocal Separation`.

Por que escolher

Preço fixo documentado de 3 créditos por geração

Melhor para
Gerar bases de ambiência, loops e ideias de som ambiental
Entrada
Texto
Saída
Áudio
Créditos
3 créditos / geração
A primeira versão expõe apenas loop, BPM e Key como o subconjunto de parâmetros de menor riscoMantém a cadeia atual de resultados de áudio Suno com URLs de áudio padrão

Suno

Suno Lyrics

Áudio

Suno Lyrics é o modelo de geração de letras da Rivya para transformar um tema ou mood em palavras de música, com custo fixo de `1` crédito por solicitação.

Por que escolher

Geração de letras com custo fixo de 1 crédito

Melhor para
Rascunhar letras antes de gerar uma música completa
Entrada
Texto
Saída
Áudio
Créditos
1 crédito / geração
Expõe apenas o subconjunto de parâmetros somente por prompt e de menor riscoMantém o fluxo de tarefa assíncrona enquanto permite sucesso sem URLs de mídia

ElevenLabs

ElevenLabs Dialogue V3

Áudio

O modelo de diálogo com múltiplos falantes da ElevenLabs na Rivya. Ele foi criado para geração de fala com papéis definidos, com atribuições individuais de voz, controles de estabilidade e ritmo adequado para diálogo em podcasts, entrevistas e cenas com personagens.

Por que escolher

Geração de diálogo com múltiplos falantes

Melhor para
Aberturas de podcast com dois apresentadores e segmentos de debate
Entrada
Texto
Saída
Áudio
Créditos
Créditos baseados na duração ou na extensão
Atribuição individual de voz por personagemEstabilidade ajustável para interpretação consistente

ElevenLabs

ElevenLabs Turbo 2.5

Áudio

O modelo rápido de texto para fala da ElevenLabs na Rivya. Com geração de voz de baixa latência e estabilidade, similaridade, estilo e velocidade ajustáveis, ele foi criado para rascunhos rápidos de locução e projetos interativos de texto para fala.

Por que escolher

Texto para fala mais rápido da ElevenLabs — otimizado para baixa latência

Melhor para
Locuções para demonstrações de produto e passo a passo de app
Entrada
Texto
Saída
Áudio
Créditos
Créditos baseados na duração ou na extensão
Estabilidade, similaridade, estilo e velocidade ajustáveisVárias predefinições de voz com geração sensível ao contexto

ElevenLabs

ElevenLabs Multilingual V2

Áudio

O modelo multilíngue de texto para fala da ElevenLabs na Rivya, com suporte a cerca de 30 idiomas e detecção automática. É a opção mais forte para localização, execução entre idiomas e locuções multilíngues mais naturais.

Por que escolher

Detecta automaticamente e gera cerca de 30 idiomas

Melhor para
Demonstrações de produto localizadas e vídeos de integração
Entrada
Texto
Saída
Áudio
Créditos
Créditos baseados na duração ou na extensão
Entonação humanizada e nuance tonalMesmos controles de voz: estabilidade, similaridade, estilo e velocidade

ElevenLabs

ElevenLabs Sound Effect V2

Áudio

O modelo de texto para som da ElevenLabs na Rivya para efeitos curtos, transições e loops de ambiência. Gere clipes de áudio de 0,5 a 22 segundos com influência de prompt ajustável, modo de loop e 19 formatos de saída para projetos de edição, produto ou jogos.

Por que escolher

Duração de áudio configurável de 0,5 a 22 segundos

Melhor para
Cliques de interface, sons de notificação e sinais de feedback em apps
Entrada
Texto
Saída
Áudio
Créditos
Créditos baseados na duração ou na extensão
Intensidade ajustável de influência do promptModo de loop para áudio em repetição contínua

ElevenLabs

ElevenLabs Audio Isolation

Áudio

O modelo da ElevenLabs para limpeza de áudio e isolamento de voz na Rivya. Envie uma gravação para isolar vocais, remover ruído de fundo e limpar áudio falado antes de editar ou publicar.

Por que escolher

Isolamento de áudio por envio de arquivo — sem prompt necessário

Melhor para
Limpar gravações de entrevistas ou podcasts antes da edição
Entrada
Referência / Áudio
Saída
Áudio
Créditos
Créditos baseados na duração
Separação vocal e remoção de ruído de fundoCobrança medida pela duração do áudio

Encontrou alguns que valem testar?

Monte a lista de candidatos aqui e depois teste dentro da Rivya sem trocar de aplicativos, carteiras ou histórico de projeto.
6 créditos de cadastro
Cadastro rápido