Catálogo de modelos de IA

Compara modelos de imagen, video, audio y chat antes de gastar créditos

Explora 95+ modelos de IA por tarea, entrada, salida, proveedor y notas de créditos. Mira para qué sirve cada modelo, revisa ejemplos reales y luego lleva tu lista corta a Rivya para una prueba real.
6 créditos de registro
Registro rápido
ImagenVídeoVideoAudioChat

Catálogo de modelos

Encuentra modelos por tarea, entrada y salida

Filtra por modalidad, tipo de entrada, proveedor, fortalezas y notas de créditos. Abre una página de modelo para ver salidas reales, ajuste de tarea y una prueba rápida en línea.

4 tipos de modelo

Todos los modelos

Busca por modelo, proveedor, capacidad o tarea. Luego usa filtros objetivos para acotar la página sin abrir cada página de detalle.

95 opciones de modelo

Compara entrada, salida, créditos y pistas de ejemplo antes de comprometerte con una lista corta.

Comparar ajuste de modelo

Filtra por campos que Rivya ya registra para cada modelo: modalidad y entrada admitida. El ajuste de tarea se muestra en las tarjetas desde la fuente de contenido del modelo.

Pista de créditos

La guía de créditos se muestra en cada tarjeta de modelo desde el contenido del catálogo.

Modalidad

Entrada admitida

95 opciones de modelo

Compara entrada, salida, créditos y pistas de ejemplo antes de comprometerte con una lista corta.

4 tipos de modeloTodos

Buenos modelos para empezar

Empieza aquí

Alibaba

Z-Image

Imagen

El modelo ligero de texto a imagen de Alibaba. Generación rápida de una sola imagen con 5 relaciones de aspecto, ideal para borradores conceptuales rápidos y visuales de redes sociales por solo 1 crédito.

Por qué elegirlo

Coste más bajo: 1 crédito por generación

Mejor para
Conceptos visuales baratos de primera pasada
Entrada
Texto
Salida
Imagen
Créditos
Desde 1 crédito por generación
Salida rápida de una sola imagen para iteración velozTexto a imagen limpio con 5 presets de relación de aspecto

Google

Nano Banana

Imagen

Modelo de imagen flexible de Google para texto a imagen e imagen a imagen, con 11 relaciones de aspecto, hasta 10 imágenes de referencia y salida PNG/JPEG. Encaja muy bien en retratos, composiciones de producto y visuales amplios para landing pages.

Por qué elegirlo

11 relaciones de aspecto, incluidos ultraancho 21:9 y modo automático

Mejor para
Composiciones de producto con múltiples referencias visuales
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 3 créditos por generación
Hasta 10 imágenes de referencia para creación guiadaOpciones de formato de salida PNG y JPEG

Black Forest Labs

Flux 2 Pro

Imagen

Modelo insignia de Black Forest Labs con 32B parámetros. Admite texto a imagen e imagen a imagen con hasta 8 imágenes de referencia, resolución 2K y renderizado preciso de texto, creado para fotos de producto y visuales de marca.

Por qué elegirlo

Hasta resolución 2K con texturas fotorrealistas

Mejor para
Fotografías de producto e imágenes hero de ecommerce
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 5 créditos por generación
Renderizado preciso de texto y logotipos dentro de imágenesHasta 8 imágenes de referencia para consistencia de estilo o personaje

OpenAI

GPT-5.5

Chat

Modelo avanzado de chat GPT de OpenAI en Rivya para razonamiento complejo, análisis con imágenes, síntesis de investigación y escritura estructurada cuando el brief necesita más margen.

Por qué elegirlo

Techo alto para razonamiento complejo y análisis de varios pasos

Mejor para
Síntesis de investigación entre paquetes de origen largos o desordenados
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso - créditos según el uso
Admite chat con conciencia de imagen con hasta 6 imágenesBuen encaje para briefs estructurados, síntesis de investigación y escritura de decisiones

OpenAI

GPT-5.4

Chat

Modelo de chat IA de gama más alta de OpenAI en Rivya, con manejo más fuerte de entradas estructuradas, control de razonamiento y proyectos de conversación orientados a herramientas para tareas más complejas de análisis y escritura.

Por qué elegirlo

Análisis complejo y planificación de varios pasos más fuertes

Mejor para
Briefs estratégicos largos y memos de decisión
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Soporte visual con hasta 6 imágenesBueno para tareas estructuradas y conversaciones orientadas a herramientas

OpenAI

GPT-5.4 Codex

Chat

Modelo Codex de gama más alta de OpenAI en Rivya, con programación más fuerte, razonamiento estructurado y colaboración orientada a herramientas para proyectos exigentes de desarrollo a escala de repositorio.

Por qué elegirlo

Razonamiento Codex y colaboración de código de nivel superior

Mejor para
Depuración a escala de repositorio y revisión de arquitectura
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Mantiene el proyecto ResponsesBueno para código complejo, uso de herramientas y trabajo técnico de varios pasos

OpenAI

GPT-5.3 Codex

Chat

El modelo Codex más reciente y capaz de OpenAI en Rivya. Combina generación de código de vanguardia con razonamiento agentic más profundo para los proyectos de desarrollo más exigentes.

Por qué elegirlo

El modelo de código más capaz de OpenAI

Mejor para
Depuración difícil en codebases grandes
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Calidad de generación de código de vanguardiaRazonamiento más profundo para problemas complejos

OpenAI

GPT-5.2

Chat

Modelo insignia de chat IA de OpenAI en Rivya, con razonamiento avanzado, soporte visual para hasta 6 imágenes y una ventana de contexto de 20K caracteres. Es una opción GPT general sólida para investigación, planificación, escritura y análisis con conciencia de imagen.

Por qué elegirlo

Razonamiento avanzado y análisis complejo

Mejor para
Memos estratégicos y documentos de decisión
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Soporte visual: analiza hasta 6 imágenesVentana de contexto de 20K caracteres

OpenAI

GPT-5.2 Codex

Chat

Modelo Codex más avanzado de OpenAI en Rivya, con razonamiento más fuerte para tareas de ingeniería complejas. Está optimizado para programación agentic de largo horizonte, decisiones de arquitectura y refactorizaciones mayores donde la generación simple de código no basta.

Por qué elegirlo

Razonamiento más fuerte para ingeniería compleja

Mejor para
Revisiones de arquitectura y tradeoffs de diseño de sistemas
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Mejor para diseño de sistemas y arquitectura12K tokens de salida para generación de código completa

OpenAI

GPT-5.1 Codex

Chat

Modelo Codex actualizado de OpenAI en Rivya, con mejor precisión de código y razonamiento más fuerte para tareas de programación agentic. Mantiene el mismo proyecto consciente del repositorio y de salida larga, pero mejora las refactorizaciones multifichero y las ediciones de código más seguras.

Por qué elegirlo

Precisión de código mejorada frente a GPT-5 Codex

Mejor para
Refactorizaciones y migraciones multifichero
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Mejor en refactorización multificheroLímite de 12K tokens de salida para generación larga de código

OpenAI

GPT-5 Codex

Chat

Modelo GPT-5 Codex especializado en código de OpenAI en Rivya para depuración, planificación de implementación, refactorizaciones y resolución técnica de problemas con soporte visual.

Por qué elegirlo

Especializado en código con límite de 12K tokens de salida

Mejor para
Revisión de código y corrección de errores
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Optimizado para generación de código y depuraciónSoporte visual para analizar capturas/diagramas

Google

Gemini 3.1 Pro

Chat

El modelo de chat Gemini AI más reciente y capaz de Google en Rivya. Con razonamiento de primer nivel, visión y seguimiento de instrucciones, es la opción Gemini más sólida para tareas analíticas y creativas exigentes.

Por qué elegirlo

El modelo Gemini más capaz de Google

Mejor para
Paquetes de investigación de contexto largo y trabajo comparativo
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Razonamiento y seguimiento de instrucciones de primer nivelSoporte visual con hasta 6 imágenes

Google

Gemini 3 Pro

Chat

Modelo de chat IA Gemini de mayor profundidad de Google en Rivya. Con razonamiento más fuerte que Gemini 2.5 Pro y soporte visual, encaja mejor en síntesis de investigación, escritura técnica y análisis multimodal más deliberado.

Por qué elegirlo

Razonamiento mejorado frente a Gemini 2.5 Pro

Mejor para
Análisis de formato largo y recomendaciones estructuradas
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Soporte visual con hasta 6 imágenesSólido para síntesis de investigación y escritura técnica

Google

Gemini 3 Flash

Chat

Modelo de chat IA rápido de nueva generación de Google en Rivya. Con costos por token aún más bajos que Gemini 2.5 Flash y razonamiento más fuerte, está creado para chat multimodal de alto volumen, revisión inicial de capturas y trabajo rápido de asistente.

Por qué elegirlo

El precio por tokens más bajo entre todos los modelos de chat

Mejor para
Revisión inicial multimodal rápida y análisis de capturas
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Razonamiento mejorado frente a Gemini 2.5 FlashSoporte visual con hasta 6 imágenes

Google

Gemini 2.5 Pro

Chat

Modelo de chat Gemini AI más avanzado de Google en Rivya. Con razonamiento más fuerte que Flash, soporte visual y contexto 20K, encaja mejor con síntesis de investigación, análisis de documentos y escritura estructurada a 2 créditos.

Por qué elegirlo

Razonamiento más fuerte que Gemini Flash

Mejor para
Síntesis de investigación y escritos analíticos
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Soporte visual — analiza hasta 6 imágenesCosto equilibrado a 2 créditos por uso

Google

Gemini 2.5 Flash

Chat

El modelo de chat IA más rápido y asequible de Google en Rivya. Con 1 crédito por uso y soporte visual para hasta 6 imágenes, encaja con preguntas rápidas, resúmenes de primera pasada, revisión inicial de capturas y asistencia IA cotidiana.

Por qué elegirlo

Modelo de chat de menor costo a 1 crédito

Mejor para
Búsquedas de investigación rápidas y resúmenes de primera pasada
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Respuesta rápida para conversaciones en tiempo realSoporte visual — analiza hasta 6 imágenes

Anthropic

Claude Opus 4.7

Chat

Modelo de chat Claude insignia de Anthropic en Rivya para razonamiento profundo, síntesis cuidadosa, escritura ejecutiva y trabajo de texto de alto impacto.

Por qué elegirlo

Razonamiento y síntesis textual de nivel insignia

Mejor para
Memorandos ejecutivos y narrativas para el consejo directivo
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso - créditos según el uso
Muy buen ajuste para análisis de formato largo y escritura cuidadosaProyecto Claude centrado en texto en la interfaz actual de Rivya

Anthropic

Claude Opus 4.6

Chat

Modelo insignia de chat Claude AI de Anthropic en Rivya. Está creado para razonamiento profundo, análisis complejo y escritura de alta calidad en proyectos exigentes y de alto riesgo.

Por qué elegirlo

Razonamiento insignia y análisis complejo

Mejor para
Memorandos ejecutivos y escritura narrativa de alto riesgo
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Mayor techo para comprensión de formato largo y calidad de salidaProyecto Claude centrado en texto en la interfaz actual de Rivya

Anthropic

Claude Sonnet 4.6

Chat

Modelo de chat Claude AI equilibrado de Anthropic en Rivya. Mantiene un razonamiento sólido de formato largo y análisis cuidadoso para proyectos de contenido, investigación y programación sin subir al gasto de nivel Opus.

Por qué elegirlo

Razonamiento fiable con calidad equilibrada

Mejor para
Revisar informes largos, PRD y documentos de estrategia
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Comprensión sólida de formato largo y estabilidad en varios turnosProyecto Claude centrado en texto en la interfaz actual de Rivya

Anthropic

Claude Opus 4.5

Chat

Modelo insignia de chat Claude AI de Anthropic en Rivya. Es excepcional en razonamiento profundo, análisis complejo y escritura de nivel experto, lo que lo convierte en una opción premium para tareas de IA críticas.

Por qué elegirlo

El modelo más capaz de Anthropic

Mejor para
Síntesis de investigación profunda y análisis difícil
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Razonamiento profundo y análisis complejo excepcionalesEscritura de nivel experto y calidad de contenido

Anthropic

Claude Sonnet 4.5

Chat

Modelo de chat Claude AI equilibrado de Anthropic en Rivya. Destaca en escritura matizada, análisis cuidadoso y respuestas con criterio de seguridad, por lo que es una opción Claude sólida para creación de contenido e investigación.

Por qué elegirlo

Escritura matizada y análisis cuidadoso

Mejor para
Reescrituras editoriales y escritura sensible al tono
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Respuestas con criterio de seguridad y buena calibraciónProyecto Claude centrado en texto en la interfaz actual de Rivya

Anthropic

Claude Haiku 4.5

Chat

Modelo ligero de chat Claude AI de Anthropic en Rivya. Está ajustado para velocidad, eficiencia de costos y rendimiento estable de chat diario en proyectos de alta frecuencia donde quieres tono Claude sin gasto premium.

Por qué elegirlo

Más adecuado para uso de baja latencia y alta frecuencia

Mejor para
Triaje de bandeja de entrada y preguntas internas rápidas
Entrada
Texto
Salida
Texto / razonamiento
Créditos
Pago por uso — créditos según el uso
Precios de token mucho más baratos que Sonnet u OpusProyecto Claude centrado en texto en el front end actual de Rivya

Alibaba

Z-Image

Imagen

El modelo ligero de texto a imagen de Alibaba. Generación rápida de una sola imagen con 5 relaciones de aspecto, ideal para borradores conceptuales rápidos y visuales de redes sociales por solo 1 crédito.

Por qué elegirlo

Coste más bajo: 1 crédito por generación

Mejor para
Conceptos visuales baratos de primera pasada
Entrada
Texto
Salida
Imagen
Créditos
Desde 1 crédito por generación
Salida rápida de una sola imagen para iteración velozTexto a imagen limpio con 5 presets de relación de aspecto

Google

Nano Banana 2

Imagen

Modelo de imagen de nueva generación de Google con resolución 4K, 15 relaciones de aspecto (incluida la extrema 8:1), fundamentación con Google Search y hasta 14 imágenes de referencia: el generador de imágenes más flexible en Rivya.

Por qué elegirlo

Resolución de hasta 4K (1K / 2K / 4K seleccionable)

Mejor para
Conceptos de imagen de gran formato y composiciones tipo panorámica
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 5 créditos por generación
15 relaciones de aspecto, incluidas panorámicas extremas 8:1 y 1:8Fundamentación con Google Search para contexto del mundo real

Google

Nano Banana Pro

Imagen

Modelo de imagen premium de Google con salida 4K, 11 relaciones de aspecto y hasta 8 imágenes de referencia. Optimizado para visuales de marca y campaña de alta fidelidad, con mejor detalle y precisión de color.

Por qué elegirlo

Resolución de hasta 4K con fidelidad mejorada

Mejor para
Visuales de marca premium e imágenes de marketing de gama más alta
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 8 créditos por generación
11 relaciones de aspecto con opción de detección automáticaHasta 8 imágenes de referencia para consistencia de marca

Google

Nano Banana

Imagen

Modelo de imagen flexible de Google para texto a imagen e imagen a imagen, con 11 relaciones de aspecto, hasta 10 imágenes de referencia y salida PNG/JPEG. Encaja muy bien en retratos, composiciones de producto y visuales amplios para landing pages.

Por qué elegirlo

11 relaciones de aspecto, incluidos ultraancho 21:9 y modo automático

Mejor para
Composiciones de producto con múltiples referencias visuales
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 3 créditos por generación
Hasta 10 imágenes de referencia para creación guiadaOpciones de formato de salida PNG y JPEG

OpenAI

GPT Image 2

Imagen

Modelo GPT Image más nuevo de OpenAI en Rivya, con texto a imagen, imagen a imagen, hasta 16 imágenes de referencia y niveles claros de créditos para 1K / 2K / 4K.

Por qué elegirlo

Texto a imagen e imagen a imagen en una sola página de modelo de Rivya

Mejor para
Visuales de producto y campaña en alta resolución
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 3 créditos por generación
Niveles de resolución 1K, 2K y 4K para controlar mejor el presupuestoHasta 16 imágenes de referencia para briefs de edición estructurados

OpenAI

GPT Image 1.5

Imagen

Modelo de imagen de OpenAI con niveles de calidad medium/high y hasta 16 imágenes de referencia. Destaca siguiendo instrucciones complejas y renderizando escenas coherentes con relaciones espaciales precisas.

Por qué elegirlo

Hasta 16 imágenes de referencia, el máximo en Rivya

Mejor para
Visuales de producto y campaña con muchas instrucciones
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 4 créditos por generación
Niveles de calidad Medium y High para controlar costosComprensión superior de prompts gracias al modelo de lenguaje de OpenAI

OpenAI

4o Image

Imagen

El modelo 4o Image de OpenAI ya está disponible en Rivya como una ruta dedicada de texto a imagen. Por ahora mantiene una configuración de página intencionalmente estrecha: prompt más 3 relaciones de aspecto compatibles a un precio fijo de 3 créditos por imagen.

Por qué elegirlo

Entrada dedicada de OpenAI 4o Image en lugar de integrarse dentro de otro modelo

Mejor para
Visuales conceptuales rápidos desde un brief de texto
Entrada
Texto
Salida
Imagen
Créditos
Desde 3 créditos por generación
Flujo de texto a imagen con la ruta indicada de 3 créditos por imagenTres opciones de relación de aspecto documentadas: 1:1, 3:2 y 2:3

ByteDance

Seedream 5.0 Lite

Imagen

Modelo de imagen Seedream más ligero de ByteDance con precio compartido para texto a imagen y edición de imagen. Admite 8 relaciones de aspecto, hasta 14 imágenes de referencia y actualmente cuesta 6 créditos por ejecución.

Por qué elegirlo

Precio fijo de 6 créditos tanto para texto a imagen como para imagen a imagen

Mejor para
Tableros de campaña con muchas referencias y direcciones de mood
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 6 créditos por generación
Hasta 14 imágenes de referencia para proyectos de edición guiada8 relaciones de aspecto, incluida ultraancha 21:9

ByteDance

Seedream 4.5

Imagen

Modelo de imagen de gama alta de ByteDance con niveles de calidad 2K/4K, 8 relaciones de aspecto y hasta 14 imágenes de referencia. Conocido por su gradación de color cinematográfica y detalle rico de texturas en visuales de moda y lifestyle.

Por qué elegirlo

Niveles de calidad seleccionables 2K (Basic) y 4K (High)

Mejor para
Imágenes de campaña de moda y lifestyle
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 7 créditos por generación
Hasta 14 imágenes de referencia para creación guiada8 relaciones de aspecto, incluida ultraancha 21:9

ByteDance

Seedream 4.0

Imagen

Seedream 4.0 es un modelo de imagen equilibrado de ByteDance en Rivya para generación de texto a imagen, edición con imágenes de referencia y controles explícitos de salida.

Por qué elegirlo

Una sola ranura de modelo cubre tanto texto a imagen como edición de imagen

Mejor para
Visuales de estilo de vida y borradores de imagen con estilo editorial
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
6 créditos fijos por generación
Mantiene visibles los controles públicos `image_resolution` y `max_images`Admite hasta 10 imágenes de referencia para la ruta de edición

ByteDance

Seedream 3.0

Imagen

Seedream 3.0 vuelve como modelo de imagen legacy independiente en Rivya. Actualmente conserva solo la ruta pública de texto a imagen y cuesta 5 créditos por ejecución.

Por qué elegirlo

Mantiene Seedream 3.0 disponible como su propia entrada legacy de texto a imagen

Mejor para
Equipos que quieren preservar una dirección visual anterior de Seedream
Entrada
Texto
Salida
Imagen
Créditos
5 créditos fijos por generación
Expone solo el subconjunto de parámetros que la documentación pública muestra con claridadSuperficie de parámetros más ligera que las opciones Seedream más nuevas

xAI

Grok Imagine

Imagen

Modelo de imagen de xAI con fuerte interpretación creativa y 5 relaciones de aspecto. Generación de una sola imagen enfocada en expresión artística y estilos visuales no convencionales.

Por qué elegirlo

Fuerte interpretación creativa y artística

Mejor para
Visuales conceptuales atrevidos y dirección artística experimental
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 4 créditos por generación
Estilos visuales únicos, distintos de otros modelosSoporte de texto a imagen e imagen a imagen

Black Forest Labs

Flux 2 Pro

Imagen

Modelo insignia de Black Forest Labs con 32B parámetros. Admite texto a imagen e imagen a imagen con hasta 8 imágenes de referencia, resolución 2K y renderizado preciso de texto, creado para fotos de producto y visuales de marca.

Por qué elegirlo

Hasta resolución 2K con texturas fotorrealistas

Mejor para
Fotografías de producto e imágenes hero de ecommerce
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 5 créditos por generación
Renderizado preciso de texto y logotipos dentro de imágenesHasta 8 imágenes de referencia para consistencia de estilo o personaje

Black Forest Labs

Flux 2 Flex

Imagen

Variante de la familia Flux 2 enfocada en edición. Se especializa en ajustes estructurales y transferencia de estilo con hasta 8 imágenes de referencia y resolución 2K, ideal para iterar sobre visuales existentes.

Por qué elegirlo

Optimizado para edición de imágenes y transferencia de estilo

Mejor para
Editar una imagen de campaña o producto existente
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 14 créditos por generación
Hasta 8 imágenes de referencia para ediciones guiadasSalida en resolución 2K con calidad Flux 2

Black Forest Labs

Flux Kontext Max

Imagen

Modelo Flux Kontext mejorado de Black Forest Labs para generación guiada por indicaciones y tareas de edición de imagen más exigentes. Rivya actualmente mantiene texto a imagen e imagen a imagen dentro del mismo proyecto asíncrono y los cobra a un precio fijo de 8 créditos por ejecución según la política actual de la plataforma.

Por qué elegirlo

Precio fijo de 8 créditos para generación y edición en Rivya

Mejor para
Refinamientos de visual clave en una imagen importante de campaña
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 8 créditos por generación
Nivel Kontext superior para indicaciones o tareas de edición más difícilesProyecto de un solo modelo para texto a imagen y edición de una imagen

Black Forest Labs

Flux Kontext Pro

Imagen

Proyecto Flux Kontext de menor costo de Black Forest Labs para texto a imagen y edición de una sola imagen. Rivya actualmente expone texto a imagen e imagen a imagen en el mismo proyecto asíncrono de imagen, con precio fijo de 4 créditos para ambos modos según la política actual de precios de la plataforma.

Por qué elegirlo

Precio fijo de 4 créditos para generación y edición en Rivya

Mejor para
Variantes de anuncios y redes sociales desde una imagen fuente aprobada
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 4 créditos por generación
Proyecto de un solo modelo para texto a imagen y edición de una imagenInterruptor de traducción integrado para el requisito de indicación en inglés

Alibaba

Qwen2 Image

Imagen

El modelo de imagen Qwen2 de Alibaba está integrado actualmente en Rivya como un proyecto de imagen de precio fijo. Cubre con seguridad texto a imagen e imagen a imagen con el subconjunto compartido de relaciones de aspecto que exponen ambas documentaciones públicas, además de salida PNG/JPEG, reutilización de seed y un interruptor NSFW simple.

Por qué elegirlo

Precio fijo de 6 créditos para texto a imagen e imagen a imagen

Mejor para
Pósters en chino y visuales de campaña
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 6 créditos por generación
Usa `qwen2/text-to-image` para ejecuciones de texto y `qwen2/image-edit` para ejecuciones con imagen de referenciaSubconjunto seguro compartido de relaciones de aspecto en ambas documentaciones públicas de Qwen2

Alibaba

Qwen Image

Imagen

Modelo de imagen de la familia Alibaba Qwen con preajustes HD (Square, Portrait, Landscape) y salida PNG/JPEG. Fuerte en instrucciones en chino y generación visual con matices culturales.

Por qué elegirlo

Tamaños predefinidos HD: Square, Portrait 4:3/16:9, Landscape 4:3/16:9

Mejor para
Visuales de marketing en chino
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 4 créditos por generación
Fuerte comprensión de instrucciones en chinoOpciones de formato de salida PNG y JPEG

Midjourney

Midjourney

Imagen

Modelo de imagen V7 de Midjourney para texto a imagen e imagen a imagen, con modos anime Niji, 3 niveles de velocidad (Relaxed/Fast/Turbo), referencias de estilo y consistencia guiada por Omni Reference. Sigue siendo la referencia para arte cinematográfico, ilustraciones y tableros de ambiente.

Por qué elegirlo

Calidad estética incomparable: la referencia de la industria

Mejor para
Arte conceptual cinematográfico y tableros de ambiente
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 3 créditos por generación
V7 + V6.1 + V6 + modos anime Niji 7/63 niveles de velocidad: Relaxed, Fast, Turbo

Recraft

Recraft Remove Background

Imagen

Modelo de eliminación de fondo de Recraft en Rivya para aislar el sujeto de una imagen existente. Úsalo cuando el siguiente paso necesite un recurso transparente, un recorte limpio o una imagen fuente sin el fondo original.

Por qué elegirlo

Herramienta de recorte de propósito único con precio fijo de 1 crédito

Mejor para
Eliminar el fondo de una imagen de producto, retrato o catálogo antes del trabajo de diseño
Entrada
Referencia / Imagen
Salida
Imagen
Créditos
Desde 1 crédito por generación
Construida para una imagen subida y normalmente no necesita ninguna instrucciónEncaja muy bien en fotos de producto, retratos y otros recursos con bordes de sujeto legibles

Recraft

Recraft Crisp Upscale

Imagen

Modelo ligero de ampliación de imagen de Recraft en Rivya para mejoras de nitidez y claridad de bajo costo en una imagen fija aprobada. Úsalo cuando la imagen elegida solo necesite una pasada barata de pulido antes de exportar, no una ampliación pesada de nivel entrega.

Por qué elegirlo

Pasada fija de limpieza de 1 crédito para una imagen subida

Mejor para
Dar a una miniatura, gráfico social o imagen pequeña de producto un impulso rápido de claridad
Entrada
Referencia / Imagen
Salida
Imagen
Créditos
Desde 1 crédito por generación
Bueno para nitidez rápida y ampliación ligera antes de publicar o entregarNo requiere instrucción ni una escalera de tamaños que gestionar, así que funciona como prechequeo de baja fricción

Alibaba

Wan 2.7 Image Pro

Imagen

El modelo de imagen Wan 2.7 de gama más alta de Alibaba, expuesto actualmente en Rivya como un slot de imagen separado para texto a imagen y edición de imagen. El precio se mantiene fijo en 12 créditos por ejecución al conservar explícitamente la generación en una sola imagen de salida.

Por qué elegirlo

Precio fijo de 12 créditos tanto para texto a imagen como para imagen a imagen

Mejor para
Visuales clave de marca e imágenes fijas de campaña de lanzamiento
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 12 créditos por generación
Hasta 9 imágenes de referencia para proyectos de edición guiadaFamilia compartida de imagen Wan 2.7 con un nivel premium más claro

Alibaba

Wan 2.7 Image

Imagen

El modelo estándar de imagen Wan 2.7 de Alibaba se expone en Rivya como su propio slot de imagen para texto a imagen y edición de imagen, y actualmente cuesta 5 créditos por ejecución.

Por qué elegirlo

Actualmente cuesta 5 créditos por ejecución

Mejor para
Tableros de borrador sociales y de campaña con múltiples referencias
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 5 créditos por generación
Admite texto a imagen e imagen a imagenHasta 9 imágenes de referencia para ediciones guiadas

Google

Google Imagen4 Ultra

Imagen

Google Imagen4 Ultra es el nivel premium de texto a imagen de Imagen en Rivya. Actualmente está integrado como un proyecto de una sola imagen con precio fijo de 12 créditos y controles públicos de prompt, prompt negativo, relación de aspecto y seed.

Por qué elegirlo

Precio fijo de 12 créditos en Rivya

Mejor para
Arte hero para homepage y visuales premium de campaña
Entrada
Texto
Salida
Imagen
Créditos
Desde 12 créditos por generación
Nivel premium de texto a imagen con Google ImagenControles de prompt negativo, relación de aspecto y seed

Google

Google Imagen4

Imagen

Google Imagen4 es el nivel estándar de texto a imagen de Imagen en Rivya. Actualmente está integrado como un proyecto de una sola imagen con precio fijo de 8 créditos y controles públicos de prompt, prompt negativo, relación de aspecto y seed.

Por qué elegirlo

Precio fijo de 8 créditos en Rivya

Mejor para
Gráficos hero para sitios web e ilustraciones editoriales
Entrada
Texto
Salida
Imagen
Créditos
Desde 8 créditos por generación
Nivel estándar de texto a imagen con Google ImagenControles de prompt negativo, relación de aspecto y seed

Google

Google Imagen4 Fast

Imagen

Google Imagen4 Fast es el nivel ligero de texto a imagen de Imagen en Rivya. Actualmente mantiene un proyecto de una sola imagen, usa precio fijo de 4 créditos y expone controles públicos de prompt, prompt negativo, relación de aspecto y seed sin abrir salida multiimagen.

Por qué elegirlo

Precio fijo de 4 créditos en Rivya

Mejor para
Direcciones visuales rápidas para landing pages o blogs
Entrada
Texto
Salida
Imagen
Créditos
Desde 4 créditos por generación
Entrada ligera de texto a imagen con Google ImagenControles de prompt negativo, relación de aspecto y seed

Topaz

Topaz Image Upscaler

Imagen

Topaz es el escalador de imagen de nivel de entrega en Rivya para imágenes fijas aprobadas que necesitan un salto real de tamaño. Úsalo cuando la composición ya esté cerrada y el problema restante sea la resolución de exportación, el tamaño para revisión o la preparación para impresión.

Por qué elegirlo

Pensado para imágenes fijas aprobadas que necesitan un salto real a tamaño de entrega, no una composición regenerada

Mejor para
Ampliar imágenes aprobadas de ecommerce, producto o campaña para formatos de entrega mayores
Entrada
Referencia / Imagen
Salida
Imagen
Créditos
Desde 5 créditos por ejecución
Una escala clara en la UI basada en los factores 1, 2, 4 y 8 facilita elegir entre tamaño y costeEncaja mejor que Recraft Crisp Upscale cuando la imagen elegida ya es final y el tamaño de salida realmente importa

Ideogram

Ideogram V3

Imagen

Ideogram V3 es el modelo de texto a imagen de Rivya para renderizado de texto, layouts de póster y prompts de imagen orientados al diseño. El precio actual es de 4 créditos para TURBO, 7 para BALANCED y 10 para QUALITY.

Por qué elegirlo

Niveles de velocidad de renderizado: TURBO, BALANCED, QUALITY

Mejor para
Conceptos de póster y gráficos publicitarios guiados por título
Entrada
Texto
Salida
Imagen
Créditos
Desde 4 créditos por generación
Generación de imágenes Ideogram V3 orientada al diseñoSelector de expansión MagicPrompt

Ideogram

Ideogram V3 Reframe

Imagen

Ideogram V3 Reframe está integrado actualmente en Rivya como un proyecto de reencuadre de una sola imagen con precios por velocidad de renderizado. El precio actual es de 4 créditos para TURBO, 7 para BALANCED y 10 para QUALITY.

Por qué elegirlo

Niveles de velocidad de renderizado: TURBO, BALANCED, QUALITY

Mejor para
Adaptar un visual aprobado a nuevas relaciones de aspecto
Entrada
Referencia / Imagen
Salida
Imagen
Créditos
Desde 4 créditos por generación
Proyecto de reencuadre de una sola imagenEl prompt es opcional para este modelo

Ideogram

Ideogram V3 Remix

Imagen

Ideogram V3 Remix está integrado actualmente en Rivya como un proyecto de remix de una sola imagen con precios por velocidad de renderizado. El precio actual es de 4 créditos para TURBO, 7 para BALANCED y 10 para QUALITY.

Por qué elegirlo

Niveles de velocidad de renderizado: TURBO, BALANCED, QUALITY

Mejor para
Direcciones artísticas alternativas desde una imagen fuente
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 4 créditos por generación
Proyecto de remix de una sola imagenControles de MagicPrompt, strength y prompt negativo

Ideogram

Ideogram Character

Imagen

Opción de consistencia de personaje para convertir una imagen de personaje aprobada en nuevas escenas, atuendos y formatos. Úsala cuando la retención de identidad importe más que la edición amplia de imágenes y solo necesites una imagen de salida por vez.

Por qué elegirlo

Proyecto de una sola referencia ajustado para mantener un personaje reconocible en nuevas escenas

Mejor para
Mantener reconocible una mascota, avatar o personaje ilustrado en muchas escenas nuevas
Entrada
Texto / Referencia / Imagen
Salida
Imagen
Créditos
Desde 12 créditos por generación
Separado de Ideogram V3, Reframe y Remix para que los usuarios elijan consistencia en lugar de mayor libertad de ediciónSalida predecible de una imagen con niveles de crédito TURBO, BALANCED y QUALITY

ByteDance

Seedance 2.0

Vídeo

Modelo completo de vídeo Seedance 2.0 de ByteDance con soporte explícito para generación solo con prompt, animación guiada por fotogramas y generación con referencia multimodal. Rivya mantiene explícita la división documentada de roles para que las entradas de fotograma y las referencias multimodales se mantengan mutuamente excluyentes en lugar de caer en un único contenedor ambiguo de subida.

Por qué elegirlo

División completa de escenas Seedance 2.0: texto, fotogramas y referencia multimodal

Mejor para
Vídeos cortos de mayor calidad desde prompts, fotogramas o paquetes de referencia
Entrada
Texto
Salida
Video
Créditos
Desde 64 créditos por ejecución
Proyectos guiados por prompt, por fotogramas y por referencias multimodales en un solo modeloSalida 480p y 720p con soporte de relación de aspecto adaptive

ByteDance

Seedance 2.0 Fast

Vídeo

Modelo de vídeo Seedance 2.0 más rápido de ByteDance, con enrutamiento completo de escenas para generación solo con prompt, animación de imagen guiada por fotogramas y generación de vídeo con referencia multimodal. Rivya mantiene explícita la división documentada de escenas para que las entradas de primer/último fotograma no se confundan con los roles de imagen, vídeo y audio de referencia.

Por qué elegirlo

División completa de escenas Seedance 2.0 Fast: texto, fotogramas y referencia multimodal

Mejor para
Previsualización rápida de anuncios desde prompts o fotogramas de storyboard
Entrada
Texto
Salida
Video
Créditos
Desde 52 créditos por ejecución
Salida 480p y 720p con soporte de relación de aspecto adaptiveGeneración opcional de audio sincronizado y devolución del fotograma final

ByteDance

Seedance 1.5 Pro

Vídeo

Modelo de vídeo insignia de ByteDance para texto a vídeo e imagen a vídeo con sincronización audiovisual nativa. Clips de 480p-1080p y 4-12s, 6 relaciones de aspecto, control de lente dinámica/fija, generación de audio opcional y compatibilidad con lip sync.

Por qué elegirlo

Sincronización audiovisual nativa con lip sync preciso

Mejor para
Clips cortos con diálogo y movimiento sincronizados
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
Desde 28 créditos por generación
Opciones de resolución 480p / 720p / 1080pDuración configurable de clip de 4s, 8s o 12s

ByteDance

Seedance 1.0 Pro

Vídeo

El modelo Seedance 1.0 Pro de ByteDance se expone en Rivya como la opción estándar 1.0 Pro tanto para texto a vídeo como para imagen a vídeo. Mantiene la configuración actual de la página alineada con la documentación pública V1 Pro mediante controles de resolución, duración, bloqueo de cámara, seed y comprobación de seguridad.

Por qué elegirlo

Admite tanto texto a vídeo como imagen a vídeo

Mejor para
Clips cinematográficos cortos
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
Desde 25 créditos por generación
Niveles de salida 480p, 720p y 1080pControles de duración 5s y 10s

ByteDance

Seedance 1.0 Pro Fast

Vídeo

Modelo rápido de imagen a vídeo de ByteDance. Anima una sola imagen de referencia en clips de 5s o 10s a 720p/1080p, optimizado para velocidad cuando necesitas vídeo rápido a partir de una imagen fija.

Por qué elegirlo

Especialista en imagen a vídeo con entrega rápida

Mejor para
Animación rápida de imagen fija a vídeo
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
16-72 créditos por generación
Opciones de resolución 720p y 1080pDuración de clip de 5s o 10s

ByteDance

Seedance 1.0 Lite

Vídeo

El modelo Seedance 1.0 Lite de ByteDance se expone en Rivya como la opción 1.0 más ligera tanto para texto a vídeo como para imagen a vídeo. Sigue el conjunto público de parámetros V1 Lite y actualmente usa una escala de precios más baja que Seedance 1.0 Pro.

Por qué elegirlo

Admite tanto texto a vídeo como imagen a vídeo

Mejor para
Pruebas de storyboard de menor coste
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
Desde 16 créditos por generación
Precio más bajo que Seedance 1.0 ProSegunda imagen opcional como fotograma final en modo imagen a vídeo

HappyHorse

HappyHorse 1.0

Video

Un modelo de video IA flexible en Rivya para texto a video, movimiento desde una sola imagen, video con múltiples referencias de imagen y edición de video desde una sola página pública de modelo.

Por qué elegirlo

Una página de modelo cubre flujos de texto, imagen, referencia y edición de video

Mejor para
Borradores cortos de anuncio o producto desde un brief escrito
Entrada
Texto / Referencia / Imagen / Video
Salida
Video
Créditos
Desde 28 créditos por generación
Admite niveles de salida fijos 720p y 1080pAcepta hasta 9 referencias de imagen cuando no hay video adjunto

Alibaba

Wan 2.7 Video

Vídeo

La línea de vídeo Wan más nueva de Alibaba con precio por resolución y duración. Rivya expone texto a vídeo, imagen a vídeo y edición de vídeo en un solo slot, desde 80 créditos por generación.

Por qué elegirlo

Precio por resolución y duración: 720p = 16 créditos/s, 1080p = 24 créditos/s

Mejor para
Promos de producto y recortes sociales con presupuesto controlado
Entrada
Texto / Referencia / Imagen / Video
Salida
Video
Créditos
Desde 80 créditos por generación
Admite texto a vídeo, imagen a vídeo y edición de vídeo en un solo slot de modeloImagen a vídeo puede usar una imagen o un par de primer y último fotograma

Alibaba

Wan 2.6

Vídeo

La opción Wan de triple modo de Alibaba en Rivya: texto a vídeo, imagen a vídeo y edición desde vídeo fuente en un solo proyecto. Admite 720p/1080p, clips de 5 a 15 segundos y una imagen o un vídeo fuente a la vez.

Por qué elegirlo

Triple modo: texto a vídeo + imagen a vídeo + vídeo a vídeo

Mejor para
Ediciones de vídeo a vídeo desde un clip fuente existente
Entrada
Texto / Referencia / Imagen / Video
Salida
Video
Créditos
Desde 70 créditos por generación
Una opción Wan pesada que puede empezar desde un vídeo fuente en lugar de solo texto o imágenes fijasUna imagen o un vídeo fuente mantiene explícita la ruta de edición

Alibaba

Wan 2.5 Video

Vídeo

Wan 2.5 ahora se expone en Rivya como una entrada compartida para texto a vídeo e imagen a vídeo. El precio actual es `720p_5 = 60`, `720p_10 = 120`, `1080p_5 = 100` y `1080p_10 = 200` créditos.

Por qué elegirlo

Un slot de modelo para texto a vídeo e imagen a vídeo

Mejor para
Clips promocionales Wan de 5 o 10 segundos desde texto o una imagen hero
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
Desde 60 créditos por generación
Precio de negocio actualmente fijado en cuatro niveles de resolución y duraciónMantiene la cadena existente de resultados de vídeo asíncronos sin un nuevo tipo de resultado

Alibaba

Wan 2.2 A14B Turbo

Vídeo

Wan 2.2 A14B Turbo ahora cubre texto a vídeo, imagen a vídeo y una ruta de vídeo guiada por imagen y audio en Rivya. El precio actual es `480p = 8` y `720p = 12` para ejecuciones de texto o imagen, más `480p = 16`, `580p = 20` y `720p = 24` cuando una imagen y un clip de audio guían el resultado.

Por qué elegirlo

Un único slot de modelo ahora cubre generación de vídeo desde texto, imagen e imagen más audio

Mejor para
Experimentos Wan más ligeros de texto a vídeo
Entrada
Texto / Referencia / Imagen / Audio
Salida
Video
Créditos
Desde 8 créditos por generación
El precio de negocio se mantiene escalonado entre ejecuciones más ligeras de texto-imagen y ejecuciones más pesadas guiadas por imagen más audioLa ruta guiada por imagen más audio mantiene su propio subconjunto de parámetros avanzados en lugar de reducirlo todo a valores predeterminados

Alibaba

Wan Animate Replace

Vídeo

El modelo de vídeo de reemplazo de personajes de Wan en Rivya para cambiar quién aparece en un clip existente. Usa una URL pública de vídeo fuente, una URL pública de imagen de reemplazo y un nivel de resolución cuando el movimiento ya es correcto y debe cambiar el sujeto visible.

Por qué elegirlo

Mantiene la forma pública `video_url + image_url + resolution` en lugar de inventar un proyecto cargado de prompt

Mejor para
Reemplazar el sujeto o personaje en pantalla conservando el movimiento del clip fuente
Entrada
Video
Salida
Video
Créditos
Desde 12 créditos por generación
Más adecuado para cambios de sujeto o personaje donde el movimiento original debe permanecer intactoFunciona bien cuando ambos recursos ya viven en almacenamiento público y el upstream puede obtenerlos

MiniMax

Hailuo 2.3

Video

Modelo de imagen a video de MiniMax con niveles de calidad Standard/Pro, resolución 768P/1080P y clips de 6s o 10s. Conocido por movimiento más fluido y transiciones naturales desde imágenes estáticas.

Por qué elegirlo

Niveles de calidad Standard y Pro

Mejor para
Animar imágenes fijas de retrato o moda hasta convertirlas en movimiento
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
Desde 25 créditos por generación
Opciones de resolución 768P y 1080PDuración configurable de clip de 6s o 10s

MiniMax

Hailuo Pro

Video

El modelo de video Hailuo Pro anterior de MiniMax está conectado aquí como un modelo fijo de nivel Pro tanto para texto a video como para imagen a video. El modo imagen acepta 1 o 2 imágenes de referencia, con la segunda imagen usada como último frame, y cada ejecución cuesta actualmente 57 créditos.

Por qué elegirlo

Un modelo para texto a video e imagen a video

Mejor para
Borradores de movimiento de mayor calidad desde un visual clave
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
57 créditos por generación
El modo imagen admite un primer frame o un par de primer y último frameConectado en el nivel Pro fijo confirmado públicamente

MiniMax

Hailuo Standard

Video

Modelo de video Hailuo Standard anterior de MiniMax, unificado aquí como un modelo para texto a video e imagen a video. El modo imagen acepta 1 o 2 imágenes de referencia, con la segunda imagen usada como último frame, y los niveles de precio públicos verificados actualmente van de 12 a 50 créditos.

Por qué elegirlo

Un modelo para texto a video e imagen a video

Mejor para
Convertir una imagen hero en un teaser corto de movimiento
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
12-50 créditos por generación
El modo imagen admite un primer frame o un par de primer y último frameNiveles guiados por imagen 512P y 768P

Kuaishou

Kling 3.0

Video

Modelo de video premium de Kuaishou para texto a video e imagen a video, con niveles Standard (720P) / Pro (1080P), estructura de toma única o de varias tomas, duración de 3–15s, generación de audio opcional y hasta 2 imágenes de referencia.

Por qué elegirlo

Niveles de calidad Standard (720P) y Pro (1080P)

Mejor para
Previs publicitario tipo storyboard con planificación explícita de tomas
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
Desde 42 créditos por generación
Modos de generación de toma única o de varias tomasDuración flexible de clip de 3–15 segundos

Kuaishou

Kling 3.0 motion-control

Video

Opción Kling motion-control más nueva para animar un sujeto desde una imagen de referencia y un video de movimiento, con elección explícita de fuente de fondo. Úsala cuando quieras transferencia de movimiento y más control sobre si la escena debe venir del video o de la imagen.

Por qué elegirlo

Proyecto exacto de 1 imagen + 1 video de movimiento que mantiene claros los roles de identidad y movimiento

Mejor para
Ejecuciones de transferencia de movimiento donde necesitas elegir si el fondo viene del video de movimiento o de la imagen de referencia
Entrada
Texto / Referencia / Imagen / Video
Salida
Video
Créditos
Desde 20 créditos por generación
Añade `background_source` encima de la orientación del personaje, que es la mejora principal frente a Kling 2.6 motion-controlPrecio fijo Standard (720P) y Pro (1080P) de 20 / 27 créditos

Kuaishou

Kling 2.6

Video

Modelo de video de Kuaishou con generación de audio opcional, clips de 5s/10s y 3 relaciones de aspecto. Destaca en movimiento humano y animación expresiva de personajes con física natural.

Por qué elegirlo

Generación de audio opcional junto con el video

Mejor para
Interpretación de personajes y movimiento expresivo
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
Desde 55 créditos por generación
Duración de clip de 5s o 10s3 relaciones de aspecto: 1:1, 16:9, 9:16

Kuaishou

Kling 2.6 motion-control

Video

Proyecto dedicado de transferencia de movimiento para animar un sujeto desde una imagen de referencia y un video de movimiento. Úsalo cuando quieras una pasada de Kling motion-control más barata y puedas prescindir de los controles de escena adicionales de Kling 3.0 motion-control.

Por qué elegirlo

Proyecto exacto de 1 imagen + 1 video de movimiento, para dejar claro qué impulsa la identidad y qué impulsa el movimiento

Mejor para
Animar un personaje desde una imagen fija más un clip independiente de referencia de movimiento
Entrada
Texto / Referencia / Imagen / Video
Salida
Video
Créditos
Desde 16 créditos por generación
Punto de entrada más barato que Kling 3.0 motion-control, con 16 / 22 créditosEl prompt opcional permite que el clip de movimiento subido siga siendo la guía principal

Kuaishou

Kling V2.5 Turbo Pro

Video

Modelo de video Kling V2.5 Turbo Pro de Kuaishou, ahora con soporte para texto a video e imagen a video. La evidencia pública de precios cubre claramente los niveles de texto e imagen a 5 segundos y 10 segundos, así que Rivya lo asigna directamente a 42 / 84 créditos.

Por qué elegirlo

Evidencia pública de precio clara para niveles de texto e imagen

Mejor para
Previs publicitario corto desde texto o desde fotogramas inicial y final
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
42-84 créditos por generación
Texto e imagen comparten una entrada de modelo alineadaEl modo imagen admite un primer fotograma más un fotograma final opcional

Kuaishou

Kling V2.1 Master

Video

El modelo de video Kling V2.1 Master heredado de Kuaishou ahora admite tanto texto a video como imagen a video en Rivya. El precio actual es de 160 créditos por 5 segundos y 320 créditos por 10 segundos.

Por qué elegirlo

Niveles de precio fijos para 5 segundos y 10 segundos

Mejor para
Comparaciones de Kling Master heredado frente a niveles más nuevos
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
160-320 créditos por generación
Texto e imagen ahora comparten una entrada de modelo alineadaTexto conserva `aspect_ratio` mientras imagen se mantiene solo en campos respaldados por documentación

Kuaishou

Kling V2.1 Pro

Video

El modelo imagen a video Kling V2.1 Pro heredado de Kuaishou admite un primer fotograma más una imagen opcional de fotograma final. El precio actual es de 50 créditos por 5 segundos y 100 créditos por 10 segundos.

Por qué elegirlo

Solo imagen a video, con un proyecto más estrecho

Mejor para
Pruebas de tomas con antes y después o fotograma inicial y final
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
50-100 créditos por generación
Admite un primer fotograma y un fotograma final opcionalNiveles de precio fijos para 5 segundos y 10 segundos

Kuaishou

Kling V2.1 Standard

Video

Modelo imagen a video Kling V2.1 Standard heredado de Kuaishou. El precio actual es de 25 créditos por 5 segundos y 50 créditos por 10 segundos.

Por qué elegirlo

Solo imagen a video

Mejor para
Animar una imagen fija de producto en una prueba rápida de movimiento
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
25-50 créditos por generación
Niveles de precio fijos para 5 segundos y 10 segundosAdmite `negative_prompt` y `cfg_scale`

Kuaishou

Kling AI Avatar Pro

Video

Modelo Kling AI Avatar Pro de Kuaishou para avatares hablantes de mayor calidad, que usa una imagen de retrato y un clip de audio para generar video de avatar con sincronización labial. Rivya actualmente lo cobra a un precio fijo de 16 créditos por generación.

Por qué elegirlo

Proyecto fijo de avatar hablante de alta calidad con retrato más audio

Mejor para
Videos de avatar hablante de mayor calidad
Entrada
Texto / Referencia / Imagen / Audio
Salida
Video
Créditos
16 créditos por generación
Precio fijo de 16 créditos en RivyaMejor encaje para salida de sincronización labial donde la calidad va primero

Kuaishou

Kling AI Avatar Standard

Video

Modelo Kling AI Avatar Standard de Kuaishou para avatares hablantes, que usa una imagen de retrato y un clip de audio para generar video de avatar con sincronización labial. Rivya actualmente lo cobra a un precio fijo de 8 créditos por generación.

Por qué elegirlo

Proyecto fijo de avatar hablante con retrato más audio

Mejor para
Videos de avatar hablante
Entrada
Texto / Referencia / Imagen / Audio
Salida
Video
Créditos
8 créditos por generación
Precio fijo de 8 créditos en RivyaRuta directa para sincronización labial

MeiGen-AI

Infinitalk

Video

Infinitalk es un modelo de video hablado con retrato más audio. El precio actual se mide por resolución y duración del audio: 480p = 3 créditos por segundo y 720p = 12 créditos por segundo.

Por qué elegirlo

Proyecto fijo de video hablado con retrato más audio

Mejor para
Videos de avatar hablante
Entrada
Texto / Referencia / Imagen / Audio
Salida
Video
Créditos
3 o 12 créditos por segundo
Los créditos siguen la resolución y la duración verificada del audioAdmite niveles de salida 480p y 720p

Runway

Runway

Vídeo

Runway es un modelo de vídeo independiente que admite tanto texto a vídeo como imagen a vídeo. La evidencia pública de precios confirma actualmente solo 6 niveles de generación, por lo que Rivya lo mantiene en el conjunto verificado: `720p_5 = 12`, `720p_10 = 30` y `1080p_5 = 30`.

Por qué elegirlo

Evidencia pública de precios clara para niveles de texto e imagen

Mejor para
Teasers de lanzamiento de 5 segundos y anuncios sociales
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
12-30 créditos por generación
La generación desde texto y desde imagen comparten una misma entrada de modelo alineadaEl modo texto conserva `aspectRatio`, mientras que el modo imagen sigue la proporción de la imagen de origen

Runway

Runway Aleph

Video

Proyecto de transformación de video fuente para reelaborar un clip existente en un nuevo resultado visual. Usa Aleph cuando el movimiento venga de tu metraje de entrada y la dirección creativa venga de tu instrucción, con un precio fijo de 90 créditos.

Por qué elegirlo

Construido alrededor de un video fuente, así que la base de movimiento viene de tu metraje y no de una generación en blanco

Mejor para
Reelaborar un clip fuente aprobado hacia otra dirección artística o estado de ánimo
Entrada
Texto / Referencia / Video / Imagen
Salida
Video
Créditos
90 créditos por generación
Transformación guiada por instrucciones con una imagen de referencia opcional para guiar estilo o sujetoMantiene Aleph separado de la generación Runway estándar de 5 o 10 segundos desde texto o imagen

Luma

Luma Modify Video

Video

Proyecto independiente de reescritura de video fuente para llevar un clip existente hacia una nueva dirección visual. Úsalo cuando la instrucción deba transformar el metraje en sí, no solo limpiar la exportación.

Por qué elegirlo

Diseñado específicamente para reescribir video fuente, no para una mejora simple

Mejor para
Convertir un clip fuente aprobado en otro estado de ánimo, estilo o dirección artística
Entrada
Referencia / Video
Salida
Video
Créditos
30 créditos por generación
Funciona mejor con clips cortos, un solo objetivo de reescritura y una instrucción inicial en inglésEncaja mejor que los escaladores cuando deben cambiar el aspecto, la atmósfera o la dirección artística

xAI

Grok Imagine Video

Video

Modelo de video de xAI con modos creativos Fun/Normal/Spicy y 5 relaciones de aspecto. Presets de estilo únicos para distintos tonos creativos, desde juguetón hasta cinematográfico y atrevido.

Por qué elegirlo

Modos creativos únicos Fun / Normal / Spicy

Mejor para
Clips teaser estilizados y movimiento pensado para redes
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
Desde 10 créditos por generación
Niveles de salida 480p y 720p con facturación por segundoClips de 6 a 30 segundos

OpenAI

Sora 2 Pro

Vídeo

Nivel premium de Sora 2 con modos de calidad Standard/High, clips de 10s/15s y eliminación de marca de agua. Más detalle, iluminación y fidelidad de movimiento para producción de vídeo profesional.

Por qué elegirlo

Niveles de calidad Standard y High para uso de producción

Mejor para
Películas premium de producto y clips de lanzamiento
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
Desde 75 créditos por generación
Más detalle, iluminación y fidelidad de movimientoClips de 10s o 15s con soporte de prompts de 10K caracteres

OpenAI

Sora 2

Vídeo

Modelo de vídeo de OpenAI para texto a vídeo e imagen a vídeo con simulación realista del mundo, audio sincronizado, clips de 10s/15s, salidas horizontal/vertical y eliminación opcional de marca de agua.

Por qué elegirlo

Simulación del mundo físicamente precisa

Mejor para
Teasers cortos cinematográficos de producto o lanzamiento
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
Desde 6 créditos por generación
Duración de clip de 10s o 15s con soporte de prompts largos (10K caracteres)Opciones de orientación horizontal y vertical

OpenAI

Sora Watermark Remover

Vídeo

Modelo de posprocesamiento de Sora para eliminar marcas de agua en Rivya, pensado para enlaces públicos de Sora ya terminados. Úsalo después de que el vídeo ya esté aprobado, cuando la tarea restante sea eliminar la marca de agua y elegir entrega por S3 u OSS.

Por qué elegirlo

Creado específicamente para enlaces públicos `sora.chatgpt.com`, no para vídeos subidos de forma genérica

Mejor para
Eliminar la marca de agua de un enlace público de Sora antes de la entrega
Entrada
Video
Salida
Video
Créditos
3 créditos por ejecución
Mantiene la eliminación de marca de agua separada de la generación con Sora 2 y Sora 2 ProSolo dos decisiones en Rivya: la URL pública del vídeo y el destino de almacenamiento de salida

Topaz

Topaz Video Upscaler

Vídeo

Topaz es el escalador de vídeo de nivel de entrega en Rivya para clips aprobados que solo necesitan más claridad al exportar. Úsalo cuando la toma, el movimiento y el ritmo ya sean correctos y el problema restante sea la resolución o la nitidez del archivo final.

Por qué elegirlo

Ideal para clips ya aprobados a los que solo les falta claridad o resolución de entrega

Mejor para
Enfocar un clip aprobado antes de entregarlo a cliente, presentarlo o publicarlo
Entrada
Referencia / Video
Salida
Video
Créditos
12 créditos por ejecución
Proyecto de un solo vídeo y sin prompt, útil como paso final de posediciónEscala simple de 1x, 2x y 4x con el nivel fijo actual de 12 créditos

Google

Veo3.1 Quality

Vídeo

La variante de Google Veo 3.1 orientada primero a calidad para generación premium de texto a vídeo y guiada por imagen. Visuales de mayor fidelidad, realismo de movimiento más sólido y audio de fondo por defecto la convierten en la opción Veo de gama más alta de Rivya.

Por qué elegirlo

Ruta de salida Veo de gama superior en Rivya

Mejor para
Hero films de lanzamiento y spots de marca premium
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
Desde 150 créditos por generación
Mejor encaje para spots de marca premium y escenas heroEl audio de fondo se incluye por defecto

Google

Veo3.1 Fast

Vídeo

La variante rápida de Google Veo 3.1 con soporte de triple modo: texto a vídeo, imagen a vídeo y referencia a vídeo. Hasta 3 imágenes de referencia, audio nativo y controles de relación de aspecto según el modo la hacen útil para clips cinematográficos rápidos.

Por qué elegirlo

Triple modo: texto / imagen / referencia a vídeo

Mejor para
Conceptos publicitarios rápidos con audio nativo
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
Desde 20 créditos por generación
Hasta 3 imágenes de referencia para generación guiadaGeneración de audio nativo junto con el vídeo

Google

Veo3.1 Lite

Vídeo

La variante de menor coste de Google Veo 3.1. Rivya actualmente expone solo el subconjunto estable más pequeño: texto a vídeo e imagen a vídeo con un precio fijo de `10` créditos por generación.

Por qué elegirlo

Precio fijo de 10 créditos tanto para texto a vídeo como para imagen a vídeo en Rivya

Mejor para
Experimentos Veo de bajo coste antes de pagar niveles superiores
Entrada
Texto / Referencia / Imagen
Salida
Video
Créditos
10 créditos / generación
Mantiene el flujo base de generación Veo 3.1 en el nivel de coste actual más bajoAdmite generación solo con prompt y generación guiada por imagen

Suno

Suno Music

Audio

Suno Music es el modelo de texto a música de Rivya para convertir un brief corto en un primer borrador de canción, con o sin voces. Mantiene el punto de entrada fijo de `12` créditos y expone `Extend Music` como siguiente paso después de una pista correcta.

Por qué elegirlo

Precio fijo documentado de 12 créditos por generación

Mejor para
Probar la dirección de una canción antes de comprometerse con un flujo de producción más largo
Entrada
Texto
Salida
Audio
Créditos
12 créditos / generación
La primera versión se mantiene acotada en lugar de exponer toda la familia Suno de una vezLas pistas correctas pueden continuar mediante una acción Extend Music

Suno

Suno Sounds

Audio

Suno Sounds es el modelo ligero de texto a sonido de Rivya para bucles de ambiente, sonido de fondo y bocetos sonoros cortos. Mantiene el precio fijo documentado de `3` créditos por generación y permite que los resultados correctos continúen hacia `Vocal Separation`.

Por qué elegirlo

Precio fijo documentado de 3 créditos por generación

Mejor para
Generar bases de ambiente, bucles e ideas de sonido ambiental
Entrada
Texto
Salida
Audio
Créditos
3 créditos / generación
La primera versión solo expone bucle, BPM y tonalidad como el subconjunto de parámetros de menor riesgoMantiene la cadena actual de resultados de audio Suno con URLs de audio estándar

Suno

Suno Lyrics

Audio

Suno Lyrics es el modelo de generación de letras de Rivya para convertir un tema o estado de ánimo en palabras de canción con un coste fijo de `1` crédito por solicitud.

Por qué elegirlo

Generación de letras con coste fijo de 1 crédito

Mejor para
Redactar letras antes de generar una canción completa
Entrada
Texto
Salida
Audio
Créditos
1 crédito / generación
Solo expone el subconjunto de parámetros prompt-only de menor riesgoMantiene el flujo de tareas asíncronas mientras permite éxito sin URLs de medios

ElevenLabs

ElevenLabs Dialogue V3

Audio

Modelo de diálogo con varios hablantes de ElevenLabs en Rivya. Está creado para generación de voz basada en roles, con asignación individual de voces, controles de estabilidad y ritmo preparado para diálogos en podcasts, entrevistas y escenas con personajes.

Por qué elegirlo

Generación de diálogo con varios hablantes

Mejor para
Introducciones de podcasts con dos presentadores y segmentos de debate
Entrada
Texto
Salida
Audio
Créditos
Créditos según duración o longitud
Asignación individual de voz por personajeEstabilidad ajustable para una entrega consistente

ElevenLabs

ElevenLabs Turbo 2.5

Audio

Modelo rápido de texto a voz de ElevenLabs en Rivya. Con generación de voz de baja latencia y estabilidad, similitud, estilo y velocidad ajustables, está creado para borradores rápidos de locución y proyectos TTS interactivos.

Por qué elegirlo

El TTS más rápido de ElevenLabs — optimizado para baja latencia

Mejor para
Locuciones para demos de producto y recorridos de apps
Entrada
Texto
Salida
Audio
Créditos
Créditos según duración o longitud
Estabilidad, similitud, estilo y velocidad ajustablesVarios preajustes de voz con generación consciente del contexto

ElevenLabs

ElevenLabs Multilingual V2

Audio

Modelo de texto a voz multilingüe de ElevenLabs en Rivya, con soporte para unas 30 lenguas y detección automática. Es la opción más sólida para localización, entrega entre idiomas y locuciones multilingües más naturales.

Por qué elegirlo

Detecta y genera automáticamente unas 30 lenguas

Mejor para
Demos de producto localizadas y videos de incorporación
Entrada
Texto
Salida
Audio
Créditos
Créditos según duración o longitud
Entonación humana y matices tonalesLos mismos controles de voz: estabilidad, similitud, estilo y velocidad

ElevenLabs

ElevenLabs Sound Effect V2

Audio

Modelo de texto a sonido de ElevenLabs en Rivya para efectos cortos, transiciones y bucles de ambiente. Genera clips de audio de 0.5–22 segundos con influencia de indicación ajustable, modo de bucle y 19 formatos de salida para proyectos de edición, producto o juegos.

Por qué elegirlo

Duración de audio configurable de 0.5–22 segundos

Mejor para
Clics de interfaz, sonidos de notificación y señales de respuesta de apps
Entrada
Texto
Salida
Audio
Créditos
Créditos según duración o longitud
Fuerza ajustable de influencia de la indicaciónModo de bucle para audio repetible sin cortes

ElevenLabs

ElevenLabs Audio Isolation

Audio

Modelo de limpieza de audio y aislamiento de voz de ElevenLabs en Rivya. Sube una grabación para aislar voces, eliminar ruido de fondo y limpiar audio hablado antes de editarlo o publicarlo.

Por qué elegirlo

Aislamiento de audio basado en carga — no necesita indicación

Mejor para
Limpiar grabaciones de entrevistas o podcasts antes de editar
Entrada
Referencia / Audio
Salida
Audio
Créditos
Créditos según duración o longitud
Separación vocal y eliminación de ruido de fondoFacturación medida por duración del audio

¿Encontraste algunos que vale la pena probar?

Haz una lista corta de modelos aquí y luego pruébalos dentro de Rivya sin cambiar de aplicaciones, billeteras ni historial de proyecto.
6 créditos de registro
Registro rápido