Katalog modeli AI

Porównaj modele obrazu, wideo, audio i chatu, zanim wydasz kredyty

Przeglądaj 95+ modeli AI według zadania, wejścia, wyjścia, dostawcy i notatek o kredytach. Zobacz, w czym każdy model jest dobry, sprawdź prawdziwe przykłady, a potem przenieś krótką listę do Rivya na realny test.
6 kredytów za rejestrację
Szybka rejestracja
ObrazImageWideoAudioCzatChat

Katalog modeli

Znajdź modele według zadania, wejścia i wyjścia

Filtruj według modalności, typu wejścia, dostawcy, mocnych stron i notatek o kredytach. Otwórz stronę modelu, aby zobaczyć prawdziwe wyniki, dopasowanie do zadania i szybką próbę online.

4 typów modeli

Wszystkie modele

Szukaj według modelu, dostawcy, możliwości albo zadania. Potem użyj filtrów faktów, aby zawęzić stronę bez otwierania każdej strony szczegółów.

95 opcji modeli

Porównaj wejście, wyjście, kredyty i wskazówki z przykładów, zanim zdecydujesz się na krótką listę.

Porównaj dopasowanie modeli

Filtruj według pól, które Rivya już śledzi dla każdego modelu: modalności i obsługiwanego wejścia. Dopasowanie do zadania jest pokazywane na kartach z treści źródłowej modelu.

Wskazówka kredytowa

Wskazówki dotyczące kredytów są pokazywane na każdej karcie modelu z treści katalogu.

Modalność

Obsługiwane wejście

95 opcji modeli

Porównaj wejście, wyjście, kredyty i wskazówki z przykładów, zanim zdecydujesz się na krótką listę.

4 typów modeliWszystkie

Dobre modele na start

Zacznij tutaj

Alibaba

Z-Image

Obraz

Lekki model tekst-na-obraz od Alibaby. Szybkie generowanie pojedynczego obrazu z 5 proporcjami obrazu, idealne do szybkich szkiców koncepcyjnych i wizualizacji do mediów społecznościowych za zaledwie 1 kredyt.

Dlaczego go wybrać

Najniższy koszt: 1 kredyt za generowanie

Najlepsze do
Tanie pierwsze koncepcje wizualne
Wejście
Tekst
Wyjście
Obraz
Kredyty
Od 1 kredytu za generowanie
Szybki wynik pojedynczego obrazu do szybkiej iteracjiCzyste tekst-na-obraz z 5 ustawieniami proporcji obrazu

Google

Nano Banana

Obraz

Elastyczny model obrazów Google do text-to-image i image-to-image, z 11 proporcjami obrazu, obsługą do 10 obrazów referencyjnych oraz wyjściem PNG/JPEG. Dobrze pasuje do portretów, kompozycji produktowych i szerszych wizualizacji landing page.

Dlaczego go wybrać

11 proporcji obrazu, w tym ultraszerokie 21:9 i tryb automatyczny

Najlepsze do
Kompozycje produktowe z wieloma referencjami wizualnymi
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 3 kredytów za generację
Do 10 obrazów referencyjnych do prowadzonego tworzeniaOpcje formatu wyjściowego PNG i JPEG

Black Forest Labs

Flux 2 Pro

Image

Flagowy model Black Forest Labs z 32 mld parametrów. Obsługuje text-to-image i image-to-image z maksymalnie 8 obrazami referencyjnymi, rozdzielczością 2K i dokładnym renderowaniem tekstu - zbudowany do zdjęć produktowych i wizuali marki.

Dlaczego go wybrać

Do 2K rozdzielczości z fotorealistycznymi teksturami

Najlepsze do
Ujęcia produktowe i obrazy hero dla ecommerce
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 5 kredytów za generację
Dokładne renderowanie tekstu i logo na obrazachDo 8 obrazów referencyjnych dla spójności stylu lub postaci

OpenAI

GPT-5.5

Czat

Zaawansowany model czatu GPT od OpenAI w Rivya do zlozonego rozumowania, analizy z uwzglednieniem obrazow, syntezy badan i uporzadkowanego pisania, gdy brief potrzebuje wiecej przestrzeni.

Dlaczego go wybrać

Wysoki pulap dla zlozonego rozumowania i analizy wieloetapowej

Najlepsze do
Synteza badan z dlugich lub chaotycznych pakietow zrodlowych
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Platnosc wedlug uzycia - kredyty zaleza od uzycia
Obsluguje czat z obrazami dla maksymalnie 6 obrazowDobrze pasuje do uporzadkowanych briefow, syntezy badan i pisania decyzyjnego

OpenAI

GPT-5.4

Czat

Wyzej pozycjonowany model czatu AI od OpenAI w Rivya, z mocniejsza obsluga uporzadkowanych danych wejsciowych, kontrola rozumowania i projektami rozmow nastawionymi na narzedzia dla bardziej zlozonych zadan analitycznych i pisarskich.

Dlaczego go wybrać

Mocniejsza zlozona analiza i planowanie wieloetapowe

Najlepsze do
Dlugie briefy strategiczne i notatki decyzyjne
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Platnosc wedlug uzycia — kredyty zaleza od uzycia
Obsluga wizji z maksymalnie 6 obrazamiDobry do zadan uporzadkowanych i rozmow nastawionych na narzedzia

OpenAI

GPT-5.4 Codex

Czat

Wyzej pozycjonowany model Codex od OpenAI w Rivya, z mocniejszym kodowaniem, uporzadkowanym rozumowaniem i wspolpraca nastawiona na narzedzia dla wymagajacych projektow developerskich na skale repozytorium.

Dlaczego go wybrać

Wyzszy poziom rozumowania Codex i wspolpracy przy kodzie

Najlepsze do
Debugowanie na skale repozytorium i przeglad architektury
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Platnosc wedlug uzycia — kredyty zaleza od uzycia
Zachowuje projekt ResponsesDobry do zlozonego kodu, uzycia narzedzi i wieloetapowej pracy technicznej

OpenAI

GPT-5.3 Codex

Czat

Najnowszy i najbardziej zaawansowany model Codex od OpenAI w Rivya. Laczy najnowoczesniejsze generowanie kodu z glebszym agentowym rozumowaniem dla najbardziej wymagajacych projektow developerskich.

Dlaczego go wybrać

Najbardziej zaawansowany model kodu OpenAI

Najlepsze do
Trudne debugowanie w duzych codebase
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Platnosc wedlug uzycia — kredyty zaleza od uzycia
Najnowoczesniejsza jakosc generowania koduNajglebsze rozumowanie dla zlozonych problemow

OpenAI

GPT-5.2

Czat

Flagowy model czatu AI od OpenAI w Rivya, z zaawansowanym rozumowaniem, obsluga wizji dla maksymalnie 6 obrazow i oknem kontekstu 20K znakow. To mocna ogolna opcja GPT do badan, planowania, pisania i analizy z uwzglednieniem obrazow.

Dlaczego go wybrać

Zaawansowane rozumowanie i zlozona analiza

Najlepsze do
Notatki strategiczne i dokumenty decyzyjne
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Platnosc wedlug uzycia — kredyty zaleza od uzycia
Obsluga wizji — analiza do 6 obrazowOkno kontekstu 20K znakow

OpenAI

GPT-5.2 Codex

Czat

Bardziej zaawansowany model Codex od OpenAI w Rivya, z mocniejszym rozumowaniem dla zlozonych zadan inzynierskich. Jest zoptymalizowany pod dlugohoryzontowe agentowe kodowanie, decyzje architektoniczne i wieksze refaktory, w ktorych zwykle generowanie kodu nie wystarcza.

Dlaczego go wybrać

Mocniejsze rozumowanie dla zlozonej inzynierii

Najlepsze do
Przeglady architektury i kompromisy w projektowaniu systemow
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Platnosc wedlug uzycia — kredyty zaleza od uzycia
Najlepszy do projektowania systemow i architektury12K tokenow wyjsciowych dla pelniejszego generowania kodu

OpenAI

GPT-5.1 Codex

Czat

Ulepszony model Codex od OpenAI w Rivya, z lepsza dokladnoscia kodu i mocniejszym rozumowaniem dla agentowych zadan programistycznych. Zachowuje ten sam projekt z dlugim wyjsciem i swiadomoscia repozytorium, a jednoczesnie lepiej radzi sobie z refaktorami wielu plikow i bezpieczniejszymi edycjami kodu.

Dlaczego go wybrać

Lepsza dokladnosc kodu niz GPT-5 Codex

Najlepsze do
Refaktory i migracje wielu plikow
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Platnosc wedlug uzycia — kredyty zaleza od uzycia
Mocniejszy w refaktoringu wielu plikowLimit 12K tokenow wyjsciowych dla dlugiego generowania kodu

OpenAI

GPT-5 Codex

Czat

Wyspecjalizowany pod kod model GPT-5 Codex od OpenAI w Rivya do debugowania, planowania implementacji, refaktorow i rozwiazywania problemow technicznych z obsluga wizji.

Dlaczego go wybrać

Wyspecjalizowany pod kod z limitem 12K tokenow wyjsciowych

Najlepsze do
Code review i naprawa bledow
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Platnosc wedlug uzycia — kredyty zaleza od uzycia
Zoptymalizowany pod generowanie kodu i debugowanieObsluga wizji do analizy zrzutow ekranu i diagramow

Google

Gemini 3.1 Pro

Chat

Najnowszy i najbardziej zaawansowany model Gemini AI chat Google w Rivya. Z najwyższej klasy rozumowaniem, obsługą wizji i podążaniem za instrukcjami jest najmocniejszą opcją Gemini do wymagających zadań analitycznych i kreatywnych.

Dlaczego go wybrać

Najbardziej zaawansowany model Gemini Google

Najlepsze do
Pakiety badawcze z długim kontekstem i praca porównawcza
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Płatność za użycie - kredyty zależne od użycia
Rozumowanie i podążanie za instrukcjami z najwyższej półkiObsługa wizji z maksymalnie 6 obrazami

Google

Gemini 3 Pro

Chat

Model Gemini AI chat Google o większej głębi w Rivya. Z mocniejszym rozumowaniem niż Gemini 2.5 Pro i obsługą wizji lepiej nadaje się do syntezy badań, pisania technicznego i bardziej rozważnej analizy multimodalnej.

Dlaczego go wybrać

Ulepszone rozumowanie względem Gemini 2.5 Pro

Najlepsze do
Długie analizy i strukturalne rekomendacje
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Płatność za użycie - kredyty zależne od użycia
Obsługa wizji z maksymalnie 6 obrazamiMocny w syntezie badań i pisaniu technicznym

Google

Gemini 3 Flash

Chat

Nowej generacji szybki model AI chat Google w Rivya. Z jeszcze niższymi kosztami tokenów niż Gemini 2.5 Flash i mocniejszym rozumowaniem jest zbudowany do wysokowolumenowego czatu multimodalnego, triage'u zrzutów ekranu i szybkiej pracy asystenta.

Dlaczego go wybrać

Najniższa cena tokenów wśród wszystkich modeli czatu

Najlepsze do
Szybki multimodalny triage i analiza zrzutów ekranu
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Płatność za użycie - kredyty zależne od użycia
Lepsze rozumowanie niż Gemini 2.5 FlashObsługa wizji z maksymalnie 6 obrazami

Google

Gemini 2.5 Pro

Chat

Bardziej zaawansowany model Gemini AI chat Google w Rivya. Ma mocniejsze rozumowanie niż Flash, obsługę wizji i kontekst 20K, dlatego lepiej pasuje do syntezy badań, analizy dokumentów i pisania strukturalnego za 2 kredyty.

Dlaczego go wybrać

Mocniejsze rozumowanie niż Gemini Flash

Najlepsze do
Synteza badań i analityczne opracowania
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Płatność za użycie - kredyty zależne od użycia
Obsługa wizji - analiza do 6 obrazówZrównoważony koszt 2 kredytów za użycie

Google

Gemini 2.5 Flash

Chat

Najszybszy i najtańszy model AI chat Google w Rivya. Przy 1 kredycie za użycie oraz obsłudze wizji dla maksymalnie 6 obrazów pasuje do szybkich Q&A, pierwszych streszczeń, triage'u zrzutów ekranu i codziennej pomocy AI.

Dlaczego go wybrać

Najtańszy model czatu za 1 kredyt

Najlepsze do
Szybkie sprawdzenia badawcze i pierwsze streszczenia
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Płatność za użycie - kredyty zależne od użycia
Szybka odpowiedź do rozmów w czasie rzeczywistymObsługa wizji - analiza do 6 obrazów

Anthropic

Claude Opus 4.7

Chat

Flagowy model Claude chat Anthropic w Rivya do głębokiego rozumowania, uważnej syntezy, pisania dla kadry zarządzającej i tekstowej pracy o dużym wpływie.

Dlaczego go wybrać

Flagowe rozumowanie tekstowe i synteza

Najlepsze do
Notatki dla kadry zarządzającej i narracje w stylu zarządowym
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Płatność za użycie - kredyty zależne od użycia
Mocne dopasowanie do długich analiz i uważnego pisaniaTekstowy projekt Claude w obecnym froncie Rivya

Anthropic

Claude Opus 4.6

Chat

Flagowy model Claude AI chat Anthropic w Rivya. Jest zbudowany do głębokiego rozumowania, złożonej analizy i wysokiej jakości pisania w wymagających projektach o dużej stawce.

Dlaczego go wybrać

Flagowe rozumowanie i złożona analiza

Najlepsze do
Notatki dla kadry zarządzającej i narracyjne teksty o dużej stawce
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Płatność za użycie - kredyty zależne od użycia
Wyższy pułap rozumienia długich materiałów i jakości wynikówTekstowy projekt Claude w obecnym froncie Rivya

Anthropic

Claude Sonnet 4.6

Chat

Zrównoważony model Claude AI chat Anthropic w Rivya. Zachowuje mocne rozumowanie długich form i ostrożną analizę dla projektów treściowych, badawczych i kodowych bez przechodzenia na koszt poziomu Opus.

Dlaczego go wybrać

Niezawodne rozumowanie ze zrównoważoną jakością

Najlepsze do
Przegląd długich briefów, PRD i dokumentów strategicznych
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Płatność za użycie - kredyty zależne od użycia
Mocne rozumienie długich form i stabilność w wielu turachTekstowy projekt Claude w obecnym froncie Rivya

Anthropic

Claude Opus 4.5

Chat

Flagowy model chatu Claude AI od Anthropic w Rivya. Wyróżnia się głębokim rozumowaniem, złożoną analizą i pisaniem na poziomie eksperckim, dzięki czemu jest wyborem z najwyższej półki do krytycznych zadań AI.

Dlaczego go wybrać

Najbardziej zaawansowany model Anthropic

Najlepsze do
Głęboka synteza badań i trudna analiza
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Płatność za użycie — kredyty zależne od użycia
Wyjątkowe głębokie rozumowanie i złożona analizaPisanie na poziomie eksperckim i wysoka jakość treści

Anthropic

Claude Sonnet 4.5

Chat

Zrównoważony model Claude AI chat Anthropic w Rivya. Dobrze radzi sobie z niuansowym pisaniem, ostrożną analizą i odpowiedziami świadomymi bezpieczeństwa, dlatego jest mocną opcją Claude do tworzenia treści i badań.

Dlaczego go wybrać

Niuansowe pisanie i ostrożna analiza

Najlepsze do
Redakcyjne przeróbki i pisanie wrażliwe na ton
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Płatność za użycie - kredyty zależne od użycia
Odpowiedzi świadome bezpieczeństwa i dobrze skalibrowaneTekstowy projekt Claude w obecnym froncie Rivya

Anthropic

Claude Haiku 4.5

Chat

Lekki model chatu Claude AI od Anthropic w Rivya. Jest dostrojony pod szybkość, efektywność kosztową i stabilną codzienną pracę chatu w projektach o wysokiej częstotliwości, gdy chcesz tonu Claude bez wydatków premium.

Dlaczego go wybrać

Lepiej pasuje do niskich opóźnień i użycia o wysokiej częstotliwości

Najlepsze do
Triage skrzynki i szybkie wewnętrzne Q&A
Wejście
Tekst
Wyjście
Tekst / rozumowanie
Kredyty
Płatność za użycie — kredyty zależne od użycia
Znacznie tańsza wycena tokenów niż Sonnet albo OpusTekstowy projekt Claude w obecnym froncie Rivya

Alibaba

Z-Image

Obraz

Lekki model tekst-na-obraz od Alibaby. Szybkie generowanie pojedynczego obrazu z 5 proporcjami obrazu, idealne do szybkich szkiców koncepcyjnych i wizualizacji do mediów społecznościowych za zaledwie 1 kredyt.

Dlaczego go wybrać

Najniższy koszt: 1 kredyt za generowanie

Najlepsze do
Tanie pierwsze koncepcje wizualne
Wejście
Tekst
Wyjście
Obraz
Kredyty
Od 1 kredytu za generowanie
Szybki wynik pojedynczego obrazu do szybkiej iteracjiCzyste tekst-na-obraz z 5 ustawieniami proporcji obrazu

Google

Nano Banana 2

Obraz

Model obrazów nowej generacji od Google: rozdzielczość 4K, 15 proporcji obrazu (w tym skrajne 8:1), kontekst z Google Search i do 14 obrazów referencyjnych - najbardziej elastyczny generator obrazów w Rivya.

Dlaczego go wybrać

Rozdzielczość do 4K (do wyboru 1K / 2K / 4K)

Najlepsze do
Koncepcje obrazów wielkoformatowych i układy panoramiczne
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 5 kredytów za generację
15 proporcji obrazu, w tym skrajnie panoramiczne 8:1 i 1:8Kontekst z Google Search dla odniesień do realnego świata

Google

Nano Banana Pro

Obraz

Premiumowy model obrazów Google z wynikiem w 4K, 11 proporcjami obrazu i obsługą do 8 obrazów referencyjnych. Zoptymalizowany pod wysokiej jakości wizualizacje marki i kampanii, z lepszym detalem oraz dokładnością kolorów.

Dlaczego go wybrać

Rozdzielczość do 4K z podwyższoną wiernością

Najlepsze do
Premiumowe wizualizacje marki i wyższej klasy obrazy marketingowe
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 8 kredytów za generację
11 proporcji obrazu z opcją automatycznego wykrywaniaDo 8 obrazów referencyjnych dla spójności marki

Google

Nano Banana

Obraz

Elastyczny model obrazów Google do text-to-image i image-to-image, z 11 proporcjami obrazu, obsługą do 10 obrazów referencyjnych oraz wyjściem PNG/JPEG. Dobrze pasuje do portretów, kompozycji produktowych i szerszych wizualizacji landing page.

Dlaczego go wybrać

11 proporcji obrazu, w tym ultraszerokie 21:9 i tryb automatyczny

Najlepsze do
Kompozycje produktowe z wieloma referencjami wizualnymi
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 3 kredytów za generację
Do 10 obrazów referencyjnych do prowadzonego tworzeniaOpcje formatu wyjściowego PNG i JPEG

OpenAI

GPT Image 2

Obraz

Nowszy model GPT Image od OpenAI w Rivya, z text-to-image, image-to-image, maksymalnie 16 obrazami referencyjnymi oraz czytelnymi poziomami kredytow 1K / 2K / 4K.

Dlaczego go wybrać

Text-to-image i image-to-image na jednej stronie modelu Rivya

Najlepsze do
Wysokorozdzielcze wizualizacje produktowe i kampanijne
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 3 kredytow za generacje
Poziomy rozdzielczosci 1K, 2K i 4K dla czytelniejszej kontroli budzetuDo 16 obrazow referencyjnych dla uporzadkowanych briefow edycyjnych

OpenAI

GPT Image 1.5

Obraz

Model obrazowy OpenAI z poziomami jakosci medium/high i obsluga do 16 obrazow referencyjnych. Swietnie radzi sobie z wykonywaniem zlozonych instrukcji i renderowaniem spojnych scen z dokladnymi relacjami przestrzennymi.

Dlaczego go wybrać

Do 16 obrazow referencyjnych — najwyzszy limit w Rivya

Najlepsze do
Wizualizacje produktowe i kampanijne z duza liczba instrukcji
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 4 kredytow za generacje
Poziomy jakosci Medium i High dla kontroli kosztuLepsze rozumienie promptu dzieki modelowi jezykowemu OpenAI

OpenAI

4o Image

Obraz

Model 4o Image od OpenAI jest teraz dostępny w Rivya jako dedykowana ścieżka text-to-image. Konfiguracja strony celowo pozostaje na razie wąska: prompt oraz 3 obsługiwane proporcje przy stałej cenie 3 kredytów za obraz.

Dlaczego go wybrać

Dedykowane wejście OpenAI 4o Image zamiast ukrywania go w innym modelu

Najlepsze do
Szybkie wizualizacje koncepcyjne z briefu tekstowego
Wejście
Tekst
Wyjście
Obraz
Kredyty
Od 3 kredytów za generowanie
Przepływ text-to-image z wymienioną ścieżką 3 kredytów za obrazTrzy udokumentowane proporcje: 1:1, 3:2 i 2:3

ByteDance

Seedream 5.0 Lite

Obraz

Lżejszy model obrazów Seedream od ByteDance ze wspólną ceną dla generowania text-to-image i edycji obrazów. Obsługuje 8 proporcji, do 14 obrazów referencyjnych i obecnie kosztuje 6 kredytów za uruchomienie.

Dlaczego go wybrać

Stała cena 6 kredytów zarówno dla text-to-image, jak i image-to-image

Najlepsze do
Tablice kampanii i kierunki nastroju oparte na wielu referencjach
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 6 kredytów za generowanie
Do 14 obrazów referencyjnych w projektach edycji prowadzonych przez materiał źródłowy8 proporcji obrazu, w tym bardzo szerokie 21:9

ByteDance

Seedream 4.5

Obraz

Wysokiej klasy model obrazów ByteDance z poziomami jakości 2K/4K, 8 proporcjami obrazu i obsługą do 14 obrazów referencyjnych. Znany z filmowej korekcji kolorów i bogatego detalu tekstur w wizualizacjach fashion oraz lifestyle.

Dlaczego go wybrać

Wybieralne poziomy jakości 2K (Basic) i 4K (High)

Najlepsze do
Obrazy kampanii fashion i lifestyle
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 7 kredytów za generację
Do 14 obrazów referencyjnych do prowadzonego tworzenia8 proporcji obrazu, w tym ultraszerokie 21:9

ByteDance

Seedream 4.0

Obraz

Seedream 4.0 to zrównoważony model obrazów ByteDance w Rivya do generowania text-to-image, edycji z obrazami referencyjnymi i jawnych kontrolek wyjścia.

Dlaczego go wybrać

Jeden slot modelu obejmuje text-to-image i edycję obrazów

Najlepsze do
Wizualizacje lifestyle i szkice obrazów w stylu editorial
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Stałe 6 kredytów za generację
Pozostawia widoczne publiczne kontrolki `image_resolution` i `max_images`Obsługuje do 10 obrazów referencyjnych w ścieżce edycji

ByteDance

Seedream 3.0

Obraz

Seedream 3.0 wraca teraz w Rivya jako samodzielny legacy model obrazów. Obecnie zachowuje tylko publiczną ścieżkę text-to-image i kosztuje 5 kredytów za przebieg.

Dlaczego go wybrać

Utrzymuje Seedream 3.0 jako osobny legacy wpis text-to-image

Najlepsze do
Zespoły, które chcą zachować starszy kierunek wizualny Seedream
Wejście
Tekst
Wyjście
Obraz
Kredyty
Stałe 5 kredytów za generację
Pokazuje tylko podzbiór parametrów jasno widoczny w publicznej dokumentacjiLżejsza powierzchnia parametrów niż w nowszych opcjach Seedream

xAI

Grok Imagine

Obraz

Model obrazowy xAI z mocna interpretacja kreatywna i 5 proporcjami obrazu. Generowanie pojedynczego obrazu skupione na ekspresji artystycznej i niekonwencjonalnych stylach wizualnych.

Dlaczego go wybrać

Mocna interpretacja kreatywna i artystyczna

Najlepsze do
Odwazne wizualizacje koncepcyjne i eksperymentalny kierunek artystyczny
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 4 kredytow za generacje
Unikalne style wizualne odmienne od innych modeliObsluga text-to-image i image-to-image

Black Forest Labs

Flux 2 Pro

Image

Flagowy model Black Forest Labs z 32 mld parametrów. Obsługuje text-to-image i image-to-image z maksymalnie 8 obrazami referencyjnymi, rozdzielczością 2K i dokładnym renderowaniem tekstu - zbudowany do zdjęć produktowych i wizuali marki.

Dlaczego go wybrać

Do 2K rozdzielczości z fotorealistycznymi teksturami

Najlepsze do
Ujęcia produktowe i obrazy hero dla ecommerce
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 5 kredytów za generację
Dokładne renderowanie tekstu i logo na obrazachDo 8 obrazów referencyjnych dla spójności stylu lub postaci

Black Forest Labs

Flux 2 Flex

Image

Wariant rodziny Flux 2 skoncentrowany na edycji. Specjalizuje się w korektach strukturalnych i transferze stylu z maksymalnie 8 obrazami referencyjnymi oraz rozdzielczością 2K - idealny do iteracji na istniejących wizualach.

Dlaczego go wybrać

Zoptymalizowany pod edycję obrazu i transfer stylu

Najlepsze do
Edycja istniejącego obrazu kampanii lub produktu
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 14 kredytów za generację
Do 8 obrazów referencyjnych do prowadzonej edycjiWynik w rozdzielczości 2K z jakością Flux 2

Black Forest Labs

Flux Kontext Max

Image

Ulepszony model Flux Kontext od Black Forest Labs do bardziej wymagającego generowania prowadzonego promptem i zadań edycji obrazu. Rivya obecnie utrzymuje text-to-image i image-to-image w tym samym projekcie asynchronicznym oraz wycenia je według obecnej polityki platformy na stałe 8 kredytów za przebieg.

Dlaczego go wybrać

Stała cena 8 kredytów za generowanie i edycję w Rivya

Najlepsze do
Dopracowanie kluczowego wizuala ważnej kampanii
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 8 kredytów za generację
Wyższy poziom Kontext do trudniejszych promptów lub zadań edycyjnychJeden projekt modelu dla text-to-image i edycji jednego obrazu

Black Forest Labs

Flux Kontext Pro

Image

Tańszy projekt Flux Kontext od Black Forest Labs do text-to-image i edycji jednego obrazu. Rivya obecnie udostępnia text-to-image i image-to-image w tym samym asynchronicznym projekcie obrazu, ze stałą ceną 4 kredytów dla obu trybów według aktualnej polityki cenowej platformy.

Dlaczego go wybrać

Stała cena 4 kredytów za generowanie i edycję w Rivya

Najlepsze do
Warianty reklam i social z jednego zatwierdzonego obrazu źródłowego
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 4 kredytów za generację
Jeden projekt modelu dla text-to-image i edycji jednego obrazuWbudowany przełącznik tłumaczenia dla wymogu promptu po angielsku

Alibaba

Qwen2 Image

Obraz

Model obrazów Qwen2 od Alibaba jest obecnie zintegrowany w Rivya jako jeden projekt obrazowy o stałej cenie. Bezpiecznie obejmuje text-to-image i image-to-image ze wspólnym podzbiorem proporcji obrazu widocznym w obu publicznych dokumentacjach, a także wyjście PNG/JPEG, ponowne użycie seed i prosty przełącznik NSFW.

Dlaczego go wybrać

Stała cena 6 kredytów dla text-to-image i image-to-image

Najlepsze do
Plakaty i wizualizacje kampanii w języku chińskim
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 6 kredytów za generację
Używa `qwen2/text-to-image` dla przebiegów tekstowych i `qwen2/image-edit` dla przebiegów z obrazem referencyjnymWspólny bezpieczny podzbiór proporcji obrazu z obu publicznych dokumentacji Qwen2

Alibaba

Qwen Image

Obraz

Model obrazów z rodziny Alibaba Qwen z presetami HD (kwadrat, portret, poziom) oraz wyjściem PNG/JPEG. Mocny w promptach po chińsku i generowaniu wizualizacji z wyczuciem kontekstu kulturowego.

Dlaczego go wybrać

Presety rozmiaru HD: kwadrat, portret 4:3/16:9, poziom 4:3/16:9

Najlepsze do
Wizualizacje marketingowe w języku chińskim
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 4 kredytów za generację
Mocne rozumienie promptów po chińskuOpcje formatu wyjściowego PNG i JPEG

Midjourney

Midjourney

Obraz

Model obrazu V7 Midjourney do text-to-image i image-to-image, z trybami anime Niji, 3 poziomami szybkości (Relaxed/Fast/Turbo), referencjami stylu i spójnością prowadzoną Omni Reference. Nadal jest punktem odniesienia dla sztuki filmowej, ilustracji i moodboardów.

Dlaczego go wybrać

Niezrównana jakość estetyczna — branżowy punkt odniesienia

Najlepsze do
Filmowy concept art i moodboardy
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 3 kredytów za generowanie
V7 + V6.1 + V6 + tryby anime Niji 7/63 poziomy szybkości: Relaxed, Fast, Turbo

Recraft

Recraft Remove Background

Obraz

Model usuwania tła Recraft w Rivya do izolowania obiektu z jednego istniejącego obrazu. Używaj go, gdy kolejny krok wymaga zasobu z przezroczystością, czystego cutoutu albo obrazu źródłowego bez pierwotnego tła.

Dlaczego go wybrać

Jednofunkcyjne narzędzie do cutoutów ze stałą ceną 1 kredytu

Najlepsze do
Usuwanie tła z jednego produktu, portretu lub obrazu katalogowego przed pracą projektową
Wejście
Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 1 kredytu za generację
Zbudowane dla jednego przesłanego obrazu i zwykle niewymagające żadnego promptuMocno pasuje do zdjęć produktów, portretów i innych zasobów z czytelnymi krawędziami obiektu

Recraft

Recraft Crisp Upscale

Obraz

Lekki model powiększania obrazów Recraft w Rivya do taniego poprawiania ostrości i czytelności jednego zatwierdzonego kadru. Używaj go, gdy wybrany obraz potrzebuje tylko taniego przejścia polerującego przed eksportem, a nie cięższego powiększenia jakości finalnej dostawy.

Dlaczego go wybrać

Stałe przejście porządkujące za 1 kredyt dla jednego przesłanego obrazu

Najlepsze do
Szybkie podbicie czytelności jednej miniatury, grafiki społecznościowej lub małego zdjęcia produktu
Wejście
Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 1 kredytu za generację
Dobre do szybkiego wyostrzenia i lekkiego powiększenia przed publikacją lub przekazaniem dalejBez wymaganego promptu i bez drabinki rozmiarów do zarządzania, więc pozostaje użyteczne jako niskotarciowy precheck

Alibaba

Wan 2.7 Image Pro

Obraz

Wyższy poziom modelu obrazowego Wan 2.7 od Alibaby, obecnie udostępniony w Rivya jako osobne miejsce obrazowe dla generowania obrazu z tekstu i edycji obrazu. Cena pozostaje stała na poziomie 12 kredytów za uruchomienie, bo generowanie jest wyraźnie ograniczone do jednego obrazu wynikowego.

Dlaczego go wybrać

Stała cena 12 kredytów dla generowania z tekstu i z obrazu

Najlepsze do
Kluczowe wizualizacje marki i statyczne kadry kampanii premierowych
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 12 kredytów za generowanie
Do 9 obrazów referencyjnych w projektach edycji prowadzonej referencjamiWspólna rodzina obrazowa Wan 2.7 z wyraźniejszym poziomem premium

Alibaba

Wan 2.7 Image

Obraz

Standardowy model obrazowy Wan 2.7 od Alibaby jest udostępniony w Rivya jako osobne miejsce obrazowe dla generowania obrazu z tekstu i edycji obrazu, a obecnie kosztuje 5 kredytów za uruchomienie.

Dlaczego go wybrać

Obecnie kosztuje 5 kredytów za uruchomienie

Najlepsze do
Wieloreferencyjne plansze szkiców do sociali i kampanii
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 5 kredytów za generowanie
Obsługuje zarówno tekst-na-obraz, jak i obraz-na-obrazDo 9 obrazów referencyjnych w edycjach prowadzonych referencjami

Google

Google Imagen4 Ultra

Obraz

Google Imagen4 Ultra to premium poziom Rivya dla generowania obrazow z tekstu w rodzinie Imagen. Obecnie jest zintegrowany jako projekt z jednym obrazem, stala cena 12 kredytow oraz publicznymi kontrolkami promptu, negatywnego promptu, proporcji obrazu i seeda.

Dlaczego go wybrać

Stala cena 12 kredytow w Rivya

Najlepsze do
Grafiki hero na strone glowna i premium wizualizacje kampanii
Wejście
Tekst
Wyjście
Obraz
Kredyty
Od 12 kredytow za generacje
Premium poziom Google Imagen text-to-imageKontrolki negatywnego promptu, proporcji obrazu i seeda

Google

Google Imagen4

Obraz

Google Imagen4 to standardowy poziom Rivya dla generowania obrazow z tekstu w rodzinie Imagen. Obecnie jest zintegrowany jako projekt z jednym obrazem, stala cena 8 kredytow oraz publicznymi kontrolkami promptu, negatywnego promptu, proporcji obrazu i seeda.

Dlaczego go wybrać

Stala cena 8 kredytow w Rivya

Najlepsze do
Grafiki hero na strony i ilustracje redakcyjne
Wejście
Tekst
Wyjście
Obraz
Kredyty
Od 8 kredytow za generacje
Standardowy poziom Google Imagen text-to-imageKontrolki negatywnego promptu, proporcji obrazu i seeda

Google

Google Imagen4 Fast

Obraz

Google Imagen4 Fast to lekki poziom Rivya dla generowania obrazow z tekstu w rodzinie Imagen. Obecnie utrzymuje projekt z jednym obrazem, korzysta ze stalej ceny 4 kredytow i udostepnia publiczne kontrolki promptu, negatywnego promptu, proporcji obrazu oraz seeda bez otwierania wyjscia wieloobrazowego.

Dlaczego go wybrać

Stala cena 4 kredytow w Rivya

Najlepsze do
Szybkie kierunki wizualne dla landing page'y lub blogow
Wejście
Tekst
Wyjście
Obraz
Kredyty
Od 4 kredytow za generacje
Lekki punkt wejscia do Google Imagen text-to-imageKontrolki negatywnego promptu, proporcji obrazu i seeda

Topaz

Topaz Image Upscaler

Obraz

Topaz Image Upscaler w Rivya to narzędzie do powiększania obrazów na etap dostawy, przeznaczone dla zatwierdzonych kadrów, które potrzebują realnego skoku rozmiaru. Użyj go, gdy kompozycja jest już finalna, a pozostałym problemem jest rozdzielczość eksportu, rozmiar do recenzji albo gotowość do druku.

Dlaczego go wybrać

Stworzone dla zatwierdzonych kadrów, które potrzebują realnego skoku rozmiaru do dostawy, a nie ponownie wygenerowanej kompozycji

Najlepsze do
Powiększanie zatwierdzonych kadrów ecommerce, produktowych albo kampanijnych do większych formatów dostawy
Wejście
Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 5 kredytów za uruchomienie
Wyraźna drabinka UI oparta na współczynnikach 1, 2, 4 i 8 ułatwia wybór kompromisu między rozmiarem a kosztemLepsze dopasowanie niż Recraft Crisp Upscale, gdy wybrany kadr jest już finalny, a rozmiar wyjścia naprawdę ma znaczenie

Ideogram

Ideogram V3

Obraz

Ideogram V3 to model tekst-na-obraz w Rivya przeznaczony do renderowania tekstu, układów plakatowych i promptów obrazowych z naciskiem na projekt. Aktualny koszt to 4 kredyty dla TURBO, 7 dla BALANCED i 10 dla QUALITY.

Dlaczego go wybrać

Poziomy szybkości renderowania: TURBO, BALANCED, QUALITY

Najlepsze do
Koncepcje plakatów i grafiki reklamowe prowadzone tytułem
Wejście
Tekst
Wyjście
Obraz
Kredyty
Od 4 kredytów za generowanie
Projektowe generowanie obrazów Ideogram V3Przełącznik rozszerzania MagicPrompt

Ideogram

Ideogram V3 Reframe

Obraz

Ideogram V3 Reframe jest obecnie zintegrowany w Rivya jako projekt reframingu jednego obrazu z cenami wedlug szybkosci renderowania. Obecna cena to 4 kredyty za TURBO, 7 za BALANCED i 10 za QUALITY.

Dlaczego go wybrać

Poziomy szybkosci renderowania: TURBO, BALANCED, QUALITY

Najlepsze do
Adaptowanie jednego zatwierdzonego wizualu do nowych proporcji obrazu
Wejście
Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 4 kredytow za generacje
Projekt reframingu jednego obrazuPrompt jest opcjonalny dla tego modelu

Ideogram

Ideogram V3 Remix

Obraz

Ideogram V3 Remix jest obecnie zintegrowany w Rivya jako projekt remiksowania pojedynczego obrazu z cennikiem zależnym od szybkości renderowania. Aktualny koszt to 4 kredyty dla TURBO, 7 dla BALANCED i 10 dla QUALITY.

Dlaczego go wybrać

Poziomy szybkości renderowania: TURBO, BALANCED, QUALITY

Najlepsze do
Alternatywne kierunki artystyczne z jednego obrazu źródłowego
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 4 kredytów za generowanie
Projekt remiksowania pojedynczego obrazuKontrole MagicPrompt, siły przekształcenia i negatywnego promptu

Ideogram

Ideogram Character

Obraz

Opcja spojnosc postaci do zamieniania jednego zatwierdzonego obrazu postaci w nowe sceny, stroje i formaty. Uzyj jej, gdy zachowanie tozsamosci jest wazniejsze niz szeroka edycja obrazu i potrzebujesz tylko jednego obrazu wynikowego naraz.

Dlaczego go wybrać

Projekt z jedna referencja dostrojony do utrzymywania jednej postaci rozpoznawalnej w nowych scenach

Najlepsze do
Utrzymywanie jednej maskotki, awatara albo ilustrowanej postaci rozpoznawalnej w wielu nowych scenach
Wejście
Tekst / Referencja / Obraz
Wyjście
Obraz
Kredyty
Od 12 kredytow za generacje
Oddzielony od Ideogram V3, Reframe i Remix, aby uzytkownicy mogli wybrac spojnosc zamiast szerszej wolnosci edycjiPrzewidywalne wyjscie jednego obrazu z poziomami kredytow TURBO, BALANCED i QUALITY

ByteDance

Seedance 2.0

Wideo

Pełny model wideo Seedance 2.0 od ByteDance z jawną obsługą generowania tylko z promptu, animacji prowadzonej klatkami i generowania z referencją multimodalną. Rivya utrzymuje udokumentowany podział ról jawnie, aby wejścia klatek i referencje multimodalne pozostały wzajemnie wykluczające się, zamiast zlewać się w jeden niejasny koszyk uploadu.

Dlaczego go wybrać

Pełny podział scen Seedance 2.0: tekst, klatki i referencja multimodalna

Najlepsze do
Wyższej jakości krótkie wideo z promptów, klatek lub pakietów referencji
Wejście
Tekst
Wyjście
Wideo
Kredyty
Od 64 kredytów za przebieg
Projekty prowadzone promptem, klatkami i referencją multimodalną w jednym modeluWyjście 480p i 720p z obsługą adaptacyjnych proporcji obrazu

ByteDance

Seedance 2.0 Fast

Wideo

Szybszy model wideo Seedance 2.0 od ByteDance z pełnym routingiem scen dla generowania tylko z promptu, animacji obrazu prowadzonej klatkami i multimodalnego generowania wideo z referencją. Rivya utrzymuje udokumentowany podział scen jawnie, aby wejścia pierwszej i ostatniej klatki nie mieszały się z rolami obrazów, wideo i audio referencyjnych.

Dlaczego go wybrać

Pełny podział scen Seedance 2.0 Fast: tekst, klatki i referencja multimodalna

Najlepsze do
Szybkie prewizualizacje reklam z promptów lub klatek storyboardu
Wejście
Tekst
Wyjście
Wideo
Kredyty
Od 52 kredytów za przebieg
Wyjście 480p i 720p z obsługą adaptacyjnych proporcji obrazuOpcjonalne generowanie zsynchronizowanego audio i zwrot ostatniej klatki

ByteDance

Seedance 1.5 Pro

Wideo

Flagowy model wideo ByteDance do text-to-video i image-to-video z natywną synchronizacją audio-wideo. Klipy 480p-1080p, 4-12s, 6 proporcji obrazu, kontrola dynamicznego lub stałego obiektywu, opcjonalne generowanie audio i obsługa lip-sync.

Dlaczego go wybrać

Natywna synchronizacja audio-wideo z precyzyjnym lip-sync

Najlepsze do
Krótkie klipy ze zsynchronizowanym dialogiem i ruchem
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
Od 28 kredytów za generację
Opcje rozdzielczości 480p / 720p / 1080pKonfigurowalny czas trwania klipu 4s, 8s albo 12s

ByteDance

Seedance 1.0 Pro

Wideo

Model Seedance 1.0 Pro od ByteDance, dostępny w Rivya jako standardowa opcja 1.0 Pro dla text-to-video i image-to-video. Utrzymuje obecną konfigurację strony zgodnie z publiczną dokumentacją V1 Pro, z kontrolkami rozdzielczości, czasu trwania, blokady kamery, seed i kontroli bezpieczeństwa.

Dlaczego go wybrać

Obsługuje text-to-video i image-to-video

Najlepsze do
Krótkie klipy filmowe
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
Od 25 kredytów za generację
Poziomy wyjścia 480p, 720p i 1080pKontrolki czasu trwania 5s i 10s

ByteDance

Seedance 1.0 Pro Fast

Wideo

Szybki model image-to-video od ByteDance. Animuje pojedynczy obraz referencyjny w klipy 5s lub 10s przy 720p/1080p, zoptymalizowany pod szybkość, gdy potrzebujesz szybkiego wideo ze statycznego obrazu.

Dlaczego go wybrać

Specjalista image-to-video z szybkim czasem realizacji

Najlepsze do
Szybka animacja still-to-video
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
16-72 kredytów za generację
Opcje rozdzielczości 720p i 1080pCzas trwania klipu 5s albo 10s

ByteDance

Seedance 1.0 Lite

Wideo

Model Seedance 1.0 Lite od ByteDance jest dostępny w Rivya jako lżejsza opcja 1.0 dla text-to-video i image-to-video. Podąża za publicznym zestawem parametrów V1 Lite i obecnie używa niższej drabinki cenowej niż Seedance 1.0 Pro.

Dlaczego go wybrać

Obsługuje text-to-video i image-to-video

Najlepsze do
Tańsze testy storyboardów
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
Od 16 kredytów za generację
Niższa cena niż Seedance 1.0 ProOpcjonalny drugi obraz jako klatka końcowa w trybie image-to-video

HappyHorse

HappyHorse 1.0

Wideo

Elastyczny model wideo AI w Rivya do text-to-video, ruchu z pojedynczego obrazu, wideo z wieloma obrazami referencyjnymi i edycji wideo z jednej publicznej strony modelu.

Dlaczego go wybrać

Jedna strona modelu obejmuje workflow tekstowe, obrazowe, referencyjne i edycji wideo

Najlepsze do
Krotkie szkice reklamowe lub produktowe z pisemnego briefu
Wejście
Tekst / Referencja / Obraz / Wideo
Wyjście
Wideo
Kredyty
Od 28 kredytow za generacje
Obsluguje stale poziomy wyjscia 720p i 1080pPrzyjmuje do 9 obrazow referencyjnych, gdy nie dolaczono wideo

Alibaba

Wan 2.7 Video

Wideo

Nowsza linia wideo Wan od Alibaby z ceną zależną od rozdzielczości i czasu trwania. Rivya obecnie udostępnia tekst-na-wideo, obraz-na-wideo i edycję wideo w jednym miejscu modelu, od 80 kredytów za generowanie.

Dlaczego go wybrać

Cena według rozdzielczości i czasu trwania: 720p = 16 kredytów/s, 1080p = 24 kredyty/s

Najlepsze do
Krótkie materiały promocyjne produktów i socialowe wersje skrócone
Wejście
Tekst / Referencja / Obraz / Wideo
Wyjście
Wideo
Kredyty
Od 80 kredytów za generowanie
Obsługuje tekst-na-wideo, obraz-na-wideo i edycję wideo w jednym miejscu modeluObraz-na-wideo może używać jednego obrazu albo pary pierwszej i ostatniej klatki

Alibaba

Wan 2.6

Wideo

Trzytrybowa opcja Wan od Alibaby w Rivya: generowanie wideo z tekstu, generowanie wideo z obrazu i edycja wideo źródłowego w jednym projekcie. Obsługuje 720p/1080p, klipy 5-15 sekund oraz jeden obraz albo jedno wideo źródłowe naraz.

Dlaczego go wybrać

Trzy tryby: tekst-na-wideo + obraz-na-wideo + wideo-na-wideo

Najlepsze do
Edycje wideo-na-wideo z istniejącego klipu źródłowego
Wejście
Tekst / Referencja / Obraz / Wideo
Wyjście
Wideo
Kredyty
Od 70 kredytów za generowanie
Jedna cięższa opcja Wan, która może startować od wideo źródłowego, a nie tylko od tekstu lub nieruchomych obrazówJeden obraz albo jedno wideo źródłowe utrzymuje ścieżkę edycji wprost

Alibaba

Wan 2.5 Video

Wideo

Wan 2.5 jest teraz dostępny w Rivya jako jeden wspólny punkt wejścia dla generowania wideo z tekstu i z obrazu. Aktualne ceny to `720p_5 = 60`, `720p_10 = 120`, `1080p_5 = 100` i `1080p_10 = 200` kredytów.

Dlaczego go wybrać

Jedno miejsce modelu dla generowania wideo z tekstu i z obrazu

Najlepsze do
5- lub 10-sekundowe klipy promocyjne Wan z tekstu albo jednego obrazu głównego
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
Od 60 kredytów za generowanie
Ceny opierają się na czterech widocznych poziomach rozdzielczości i czasu trwaniaZachowuje istniejący asynchroniczny łańcuch wyników wideo bez nowego typu wyniku

Alibaba

Wan 2.2 A14B Turbo

Wideo

Wan 2.2 A14B Turbo obejmuje teraz w Rivya text-to-video, image-to-video oraz ścieżkę wideo prowadzoną obrazem i dźwiękiem. Obecne ceny to `480p = 8` i `720p = 12` dla uruchomień tekstowych lub obrazowych oraz `480p = 16`, `580p = 20` i `720p = 24`, gdy wynik prowadzą jeden obraz i jeden klip audio.

Dlaczego go wybrać

Jedno miejsce modelu obejmuje teraz generowanie wideo z tekstu, obrazu oraz obrazu plus audio

Najlepsze do
Lżejsze eksperymenty Wan text-to-video
Wejście
Tekst / Referencja / Obraz / Audio
Wyjście
Wideo
Kredyty
Od 8 kredytów za generowanie
Ceny biznesowe pozostają podzielone między lżejsze uruchomienia tekstowo-obrazowe i cięższe uruchomienia prowadzone obrazem plus audioŚcieżka prowadzona obrazem plus audio zachowuje własny podzbiór parametrów zaawansowanych zamiast sprowadzać wszystko do wartości domyślnych

Alibaba

Wan Animate Replace

Wideo

Model wideo Wan do zastępowania postaci w Rivya, przeznaczony do podmiany osoby lub widocznego podmiotu w istniejącym klipie. Użyj jednego publicznego URL wideo źródłowego, jednego publicznego URL obrazu zastępczego i poziomu rozdzielczości, gdy ruch jest już właściwy, a widoczny podmiot ma się zmienić.

Dlaczego go wybrać

Zachowuje publiczny kształt `video_url + image_url + resolution` zamiast wymyślać projekt ciężki od promptu

Najlepsze do
Zastępowanie widocznego podmiotu lub postaci przy zachowaniu ruchu klipu źródłowego
Wejście
Wideo
Wyjście
Wideo
Kredyty
Od 12 kredytów za generowanie
Najlepiej nadaje się do podmian podmiotu lub postaci, gdy oryginalny ruch powinien pozostać nienaruszonyDziała dobrze, gdy oba zasoby są już w publicznym storage i mogą zostać pobrane upstream

MiniMax

Hailuo 2.3

Wideo

Model image-to-video od MiniMax z poziomami jakosci Standard/Pro, rozdzielczoscia 768P/1080P oraz klipami 6s albo 10s. Znany z plynniejszego ruchu i naturalnych przejsc z obrazow statycznych.

Dlaczego go wybrać

Poziomy jakosci Standard i Pro

Najlepsze do
Animowanie statycznych portretow lub zdjec modowych w ruch
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
Od 25 kredytow za generacje
Opcje rozdzielczosci 768P i 1080PKonfigurowalny czas klipu 6s albo 10s

MiniMax

Hailuo Pro

Wideo

Starszy model wideo Hailuo Pro od MiniMax jest tu podlaczony jako jeden staly model poziomu Pro dla text-to-video i image-to-video. Tryb obrazu przyjmuje 1 lub 2 obrazy referencyjne, przy czym drugi obraz jest uzywany jako ostatnia klatka, a kazde uruchomienie obecnie kosztuje 57 kredytow.

Dlaczego go wybrać

Jeden model dla text-to-video i image-to-video

Najlepsze do
Wyzszej jakosci szkice ruchu z jednego kluczowego wizualu
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
57 kredytow za generacje
Tryb obrazu obsluguje pierwsza klatke albo pare pierwsza-i-ostatnia-klatkaPodlaczony na publicznie potwierdzonym stalym poziomie Pro

MiniMax

Hailuo Standard

Wideo

Starszy model wideo Hailuo Standard od MiniMax, ujednolicony tu jako jeden model dla text-to-video i image-to-video. Tryb obrazu przyjmuje 1 lub 2 obrazy referencyjne, przy czym drugi obraz jest uzywany jako ostatnia klatka, a obecnie zweryfikowane publiczne poziomy cenowe mieszcza sie w zakresie od 12 do 50 kredytow.

Dlaczego go wybrać

Jeden model dla text-to-video i image-to-video

Najlepsze do
Zamienianie jednego obrazu hero w krotki teaser ruchowy
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
12-50 kredytow za generacje
Tryb obrazu obsluguje pierwsza klatke albo pare pierwsza-i-ostatnia-klatkaPoziomy 512P i 768P dla wejsc prowadzonych obrazem

Kuaishou

Kling 3.0

Wideo

Premiumowy model wideo Kuaishou do text-to-video i image-to-video, z poziomami Standard (720P) / Pro (1080P), strukturą jedno- lub wieloujęciową, czasem trwania 3-15 s, opcjonalnym generowaniem audio i maksymalnie 2 obrazami referencyjnymi.

Dlaczego go wybrać

Poziomy jakości Standard (720P) i Pro (1080P)

Najlepsze do
Reklamowy previs w stylu storyboardu z jawnym planowaniem ujęć
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
Od 42 kredytów za generowanie
Tryby generowania jedno- lub wieloujęciowegoElastyczny czas trwania klipu 3-15 sekund

Kuaishou

Kling 3.0 motion-control

Wideo

Nowsza opcja Kling motion-control do prowadzenia jednego obiektu z jednego obrazu referencyjnego i jednego wideo ruchu, z wyraźnym wyborem źródła tła. Użyj jej, gdy chcesz transfer ruchu oraz mocniejszą kontrolę nad tym, czy scena ma pochodzić z wideo, czy z obrazu.

Dlaczego go wybrać

Dokładny projekt 1 obraz + 1 wideo ruchu utrzymuje jasny podział ról tożsamości i ruchu

Najlepsze do
Przebiegi transferu ruchu, w których trzeba wybrać, czy tło pochodzi z wideo ruchu, czy z obrazu referencyjnego
Wejście
Tekst / Referencja / Obraz / Wideo
Wyjście
Wideo
Kredyty
Od 20 kredytów za generowanie
Dodaje `background_source` na bazie orientacji postaci, co jest główną zmianą względem Kling 2.6 motion-controlStała cena Standard (720P) i Pro (1080P): 20 / 27 kredytów

Kuaishou

Kling 2.6

Wideo

Model wideo Kuaishou z opcjonalnym generowaniem audio, klipami 5 s / 10 s i 3 proporcjami obrazu. Mocny w ruchu ludzi i ekspresyjnej animacji postaci z naturalną fizyką.

Dlaczego go wybrać

Opcjonalne generowanie audio razem z wideo

Najlepsze do
Występ postaci i ekspresyjny ruch
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
Od 55 kredytów za generowanie
Czas trwania klipu 5 s albo 10 s3 proporcje obrazu: 1:1, 16:9, 9:16

Kuaishou

Kling 2.6 motion-control

Wideo

Dedykowany projekt transferu ruchu, który prowadzi jeden obiekt z jednego obrazu referencyjnego i jednego wideo ruchu. Użyj go, gdy chcesz tańszy przebieg Kling motion-control i możesz obyć się bez dodatkowych kontroli sceny z Kling 3.0 motion-control.

Dlaczego go wybrać

Dokładny projekt 1 obraz + 1 wideo ruchu, więc jasne jest, co prowadzi tożsamość, a co ruch

Najlepsze do
Prowadzenie jednej postaci ze statycznego obrazu za pomocą osobnego klipu referencyjnego ruchu
Wejście
Tekst / Referencja / Obraz / Wideo
Wyjście
Wideo
Kredyty
Od 16 kredytów za generowanie
Tańszy punkt wejścia niż Kling 3.0 motion-control przy 16 / 22 kredytachOpcjonalny prompt pozwala, aby przesłany klip ruchu pozostał głównym sterownikiem

Kuaishou

Kling V2.5 Turbo Pro

Wideo

Model wideo Kling V2.5 Turbo Pro od Kuaishou obsługuje teraz zarówno text-to-video, jak i image-to-video. Publicznie potwierdzone ceny jasno obejmują poziomy tekstowe i obrazowe przy 5 oraz 10 sekundach, więc Rivya mapuje go bezpośrednio na 42 / 84 kredyty.

Dlaczego go wybrać

Jasno potwierdzone publiczne ceny dla poziomów tekstowych i obrazowych

Najlepsze do
Krótki reklamowy previs z tekstu albo kadrów pierwszego i końcowego
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
42-84 kredytów za generowanie
Generowanie z tekstu i obrazu współdzieli jeden wyrównany wpis modeluTryb obrazowy obsługuje pierwszy kadr plus opcjonalny kadr końcowy

Kuaishou

Kling V2.1 Master

Wideo

Starszy model wideo Kling V2.1 Master od Kuaishou obsługuje teraz w Rivya zarówno text-to-video, jak i image-to-video. Aktualny koszt to 160 kredytów za 5 sekund i 320 kredytów za 10 sekund.

Dlaczego go wybrać

Stałe poziomy ceny dla 5 i 10 sekund

Najlepsze do
Porównania legacy Kling Master z nowszymi poziomami
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
160-320 kredytów za generowanie
Generowanie z tekstu i obrazu współdzieli teraz jeden wyrównany wpis modeluTryb tekstowy zachowuje `aspect_ratio`, a tryb obrazowy pozostaje tylko przy polach potwierdzonych dokumentacją

Kuaishou

Kling V2.1 Pro

Wideo

Starszy model image-to-video Kling V2.1 Pro od Kuaishou obsługuje pierwszy kadr oraz opcjonalny obraz kadru końcowego. Aktualny koszt to 50 kredytów za 5 sekund i 100 kredytów za 10 sekund.

Dlaczego go wybrać

Tylko image-to-video, z węższym projektem

Najlepsze do
Testy ujęć before-and-after albo z kadrem startowym i końcowym
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
50-100 kredytów za generowanie
Obsługuje pierwszy kadr i opcjonalny kadr końcowyStałe poziomy ceny dla 5 i 10 sekund

Kuaishou

Kling V2.1 Standard

Wideo

Starszy model image-to-video Kling V2.1 Standard od Kuaishou. Aktualny koszt to 25 kredytów za 5 sekund i 50 kredytów za 10 sekund.

Dlaczego go wybrać

Tylko image-to-video

Najlepsze do
Animowanie jednego zdjęcia produktu w szybki test ruchu
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
25-50 kredytów za generowanie
Stałe poziomy ceny dla 5 i 10 sekundObsługuje `negative_prompt` i `cfg_scale`

Kuaishou

Kling AI Avatar Pro

Wideo

Wyższej jakości model mówiącego awatara Kling AI Avatar Pro od Kuaishou, używający jednego obrazu portretowego i jednego klipu audio do generowania wideo awatara zsynchronizowanego z ustami. Rivya obecnie wycenia go na stałe 16 kredytów za generowanie.

Dlaczego go wybrać

Stały, wysokiej jakości projekt mówiącego awatara: portret plus audio

Najlepsze do
Wyższej jakości wideo z mówiącym awatarem
Wejście
Tekst / Referencja / Obraz / Audio
Wyjście
Wideo
Kredyty
16 kredytów za generowanie
Stała cena 16 kredytów w RivyaLepsze dopasowanie do wyjścia lip-sync, gdy jakość jest pierwsza

Kuaishou

Kling AI Avatar Standard

Wideo

Model mówiącego awatara Kling AI Avatar Standard od Kuaishou, używający jednego obrazu portretowego i jednego klipu audio do generowania wideo awatara zsynchronizowanego z ustami. Rivya obecnie wycenia go na stałe 8 kredytów za generowanie.

Dlaczego go wybrać

Stały projekt mówiącego awatara: portret plus audio

Najlepsze do
Wideo z mówiącym awatarem
Wejście
Tekst / Referencja / Obraz / Audio
Wyjście
Wideo
Kredyty
8 kredytów za generowanie
Stała cena 8 kredytów w RivyaProsta ścieżka lip-sync

MeiGen-AI

Infinitalk

Wideo

Infinitalk to model mówiącego wideo oparty na portrecie i audio. Aktualny koszt jest mierzony według rozdzielczości oraz długości audio: 480p = 3 kredyty za sekundę, a 720p = 12 kredytów za sekundę.

Dlaczego go wybrać

Stały projekt mówiącego wideo: portret plus audio

Najlepsze do
Wideo z mówiącym awatarem
Wejście
Tekst / Referencja / Obraz / Audio
Wyjście
Wideo
Kredyty
3 lub 12 kredytów za sekundę
Kredyty zależą od rozdzielczości i zweryfikowanej długości audioObsługuje poziomy wyjścia 480p i 720p

Runway

Runway

Wideo

Runway to samodzielny model wideo obsługujący text-to-video i image-to-video. Publiczne dowody cenowe potwierdzają obecnie tylko 6 poziomów generowania, więc Rivya trzyma go przy zweryfikowanym zestawie: `720p_5 = 12`, `720p_10 = 30` i `1080p_5 = 30`.

Dlaczego go wybrać

Jasne publiczne dowody cenowe dla poziomów tekstowych i obrazowych

Najlepsze do
5-sekundowe teasery premier i reklamy społecznościowe
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
12-30 kredytów za generację
Generowanie z tekstu i obrazu współdzieli jeden spójny wpis modeluTryb tekstowy zachowuje `aspectRatio`, a tryb obrazowy podąża za proporcjami obrazu źródłowego

Runway

Runway Aleph

Wideo

Projekt transformacji wideo źródłowego do przerabiania istniejącego klipu na nowy wynik wizualny. Używaj Aleph, gdy ruch pochodzi z materiału wejściowego, a kierunek kreatywny z promptu, przy stałej cenie 90 kredytów.

Dlaczego go wybrać

Zbudowany wokół jednego wideo źródłowego, więc podstawa ruchu pochodzi z Twojego materiału, a nie z pustej generacji

Najlepsze do
Przerabianie zatwierdzonego klipu źródłowego na inny kierunek artystyczny lub nastrój
Wejście
Tekst / Referencja / Wideo / Obraz
Wyjście
Wideo
Kredyty
90 kredytów za generację
Transformacja prowadzona promptem z jednym opcjonalnym obrazem referencyjnym do prowadzenia stylu lub obiektuTrzyma Aleph osobno od standardowej generacji Runway z 5 albo 10 sekundami z tekstu lub obrazu

Luma

Luma Modify Video

Wideo

Samodzielny projekt przepisywania wideo źródłowego, który przesuwa jeden istniejący klip w nowym kierunku wizualnym. Użyj go, gdy prompt ma przekształcić sam materiał, a nie tylko wyostrzyć eksport.

Dlaczego go wybrać

Zaprojektowany do przepisywania wideo źródłowego, nie do prostego ulepszania

Najlepsze do
Zmiana jednego zatwierdzonego klipu źródłowego w inny nastrój, styl albo kierunek artystyczny
Wejście
Referencja / Wideo
Wyjście
Wideo
Kredyty
30 kredytów za generowanie
Najlepszy przy krótkich klipach z jednym celem przepisania i jednym promptem zaczynającym się po angielskuLepsze dopasowanie niż upscalery, gdy ma zmienić się wygląd, atmosfera albo kierunek artystyczny

xAI

Grok Imagine Video

Wideo

Model wideo xAI z trybami kreatywnymi Fun/Normal/Spicy i 5 proporcjami obrazu. Unikalne presety stylu dla roznych tonow kreatywnych — od zabawnego, przez filmowy, po bardziej ostry.

Dlaczego go wybrać

Unikalne tryby kreatywne Fun / Normal / Spicy

Najlepsze do
Stylizowane teaserowe klipy i ruch social-first
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
Od 10 kredytow za generacje
Poziomy wyjscia 480p i 720p z rozliczaniem za sekundeKlipy od 6 do 30 sekund

OpenAI

Sora 2 Pro

Wideo

Wyższy poziom Sora 2 z trybami jakości Standard/High, klipami 10s/15s i usuwaniem znaku wodnego. Lepsza szczegółowość, światło i wierność ruchu dla profesjonalnej produkcji wideo.

Dlaczego go wybrać

Poziomy jakości Standard i High do zastosowań produkcyjnych

Najlepsze do
Premium filmy produktowe i klipy premierowe
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
Od 75 kredytów za generowanie
Lepsza szczegółowość, światło i wierność ruchuKlipy 10s lub 15s z obsługą promptu do 10 tys. znaków

OpenAI

Sora 2

Wideo

Model wideo OpenAI do text-to-video i image-to-video z realistyczną symulacją świata, zsynchronizowanym dźwiękiem, klipami 10s/15s, wyjściem poziomym lub pionowym oraz opcjonalnym usuwaniem znaku wodnego.

Dlaczego go wybrać

Fizycznie trafna symulacja świata

Najlepsze do
Krótkie filmowe teasery produktu lub premiery
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
Od 6 kredytów za generowanie
Czas trwania klipu 10s lub 15s z obsługą długiego promptu (10 tys. znaków)Opcje orientacji poziomej i pionowej

OpenAI

Sora Watermark Remover

Wideo

Model post-processingu Sora w Rivya do usuwania znaku wodnego z gotowych publicznych linków udostępniania Sora. Użyj go po ukończeniu wideo, gdy pozostałym zadaniem jest usunięcie znaku wodnego oraz wybór dostawy przez S3 albo OSS.

Dlaczego go wybrać

Zbudowany specjalnie dla publicznych linków udostępniania `sora.chatgpt.com`, a nie ogólnych przesyłanych filmów

Najlepsze do
Usuwanie znaku wodnego z publicznego linku udostępniania Sora przed dostawą
Wejście
Wideo
Wyjście
Wideo
Kredyty
3 kredyty za uruchomienie
Oddziela usuwanie znaku wodnego od generowania w Sora 2 i Sora 2 ProTylko dwie decyzje w Rivya: publiczny URL wideo i docelowe miejsce przechowywania wyniku

Topaz

Topaz Video Upscaler

Wideo

Topaz Video Upscaler w Rivya to narzędzie do powiększania wideo na etap dostawy, przeznaczone dla zatwierdzonych klipów, które potrzebują tylko większej klarowności przy eksporcie. Użyj go, gdy ujęcie, ruch i rytm są już właściwe, a pozostałym problemem jest rozdzielczość albo ostrość finalnego pliku.

Dlaczego go wybrać

Najlepsze dla już zatwierdzonych klipów, którym brakuje tylko klarowności albo rozdzielczości do dostawy

Najlepsze do
Wyostrzanie zatwierdzonego klipu przed dostawą do klienta, prezentacją albo publikacją
Wejście
Referencja / Wideo
Wyjście
Wideo
Kredyty
12 kredytów za uruchomienie
Projekt jednowideo bez promptu sprawia, że dobrze działa jako wykończeniowy krok po edycjiProsta drabinka 1x, 2x i 4x przy obecnym stałym poziomie 12 kredytów

Google

Veo3.1 Quality

Wideo

Wariant Google Veo 3.1 nastawiony najpierw na jakość, przeznaczony do premium text-to-video i generowania prowadzonego obrazem. Wyższa wierność wizualna, mocniejszy realizm ruchu i domyślny dźwięk tła czynią go wyższą opcją Veo w Rivya.

Dlaczego go wybrać

Wyższa ścieżka wyjścia Veo w Rivya

Najlepsze do
Filmy hero na premierę i premium spoty marki
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
Od 150 kredytów za generowanie
Lepsze dopasowanie do premium spotów marki i scen heroDźwięk tła jest domyślnie wliczony

Google

Veo3.1 Fast

Wideo

Szybszy wariant Google Veo 3.1 z obsługą trzech trybów: text-to-video, image-to-video i reference-to-video. Do 3 obrazów referencyjnych, natywny dźwięk i kontrola proporcji świadoma trybu sprawiają, że dobrze nadaje się do szybkich klipów filmowych.

Dlaczego go wybrać

Trzy tryby: text / image / reference-to-video

Najlepsze do
Szybkie koncepcje reklam z natywnym dźwiękiem
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
Od 20 kredytów za generowanie
Do 3 obrazów referencyjnych do prowadzonego generowaniaNatywne generowanie dźwięku razem z wideo

Google

Veo3.1 Lite

Wideo

Najtańszy wariant Google Veo 3.1. Rivya obecnie udostępnia tylko najmniejszy stabilny podzbiór: text-to-video i image-to-video przy stałej cenie `10` kredytów za generowanie.

Dlaczego go wybrać

Stała cena 10 kredytów zarówno dla text-to-video, jak i image-to-video w Rivya

Najlepsze do
Niskokosztowe eksperymenty Veo przed płaceniem za wyższe poziomy
Wejście
Tekst / Referencja / Obraz
Wyjście
Wideo
Kredyty
10 kredytów / generowanie
Utrzymuje bazowy przepływ generowania Veo 3.1 na obecnie najniższym poziomie kosztuObsługuje generowanie wyłącznie z promptu oraz generowanie prowadzone obrazem

Suno

Suno Music

Audio

Suno Music to model Rivya typu text-to-music, który zmienia jeden krótki brief w pierwszy szkic piosenki z wokalem albo bez. Zachowuje stały punkt wejścia `12` kredytów i pokazuje `Extend Music` jako następny krok po udanym utworze.

Dlaczego go wybrać

Udokumentowana stała cena 12 kredytów za generowanie

Najlepsze do
Testowanie kierunku piosenki przed wejściem w dłuższy przepływ produkcyjny
Wejście
Tekst
Wyjście
Audio
Kredyty
12 kredytów / generowanie
Pierwsza wersja pozostaje wąska zamiast od razu wystawiać całą rodzinę SunoUdane utwory mogą być kontynuowane przez akcję Extend Music

Suno

Suno Sounds

Audio

Suno Sounds to lekki model Rivya typu text-to-sound do pętli ambientowych, dźwięku tła i krótkich szkiców brzmieniowych. Zachowuje udokumentowaną stałą cenę `3` kredytów za generowanie i pozwala kontynuować udane wyniki przez `Vocal Separation`.

Dlaczego go wybrać

Udokumentowana stała cena 3 kredytów za generowanie

Najlepsze do
Generowanie podkładów ambientowych, pętli i pomysłów na dźwięki środowiskowe
Wejście
Tekst
Wyjście
Audio
Kredyty
3 kredyty / generowanie
Pierwsza wersja udostępnia tylko loop, BPM i tonację jako najniższego ryzyka podzbiór parametrówZachowuje obecny łańcuch wyników audio Suno ze standardowymi URL-ami audio

Suno

Suno Lyrics

Audio

Suno Lyrics to model Rivya do generowania tekstów piosenek, który zmienia jeden temat albo nastrój w słowa utworu przy stałym koszcie `1` kredytu za żądanie.

Dlaczego go wybrać

Stałe generowanie tekstu za 1 kredyt

Najlepsze do
Szkicowanie tekstu przed generowaniem pełnej piosenki
Wejście
Tekst
Wyjście
Audio
Kredyty
1 kredyt / generowanie
Udostępnia tylko najniższego ryzyka podzbiór parametrów opartych na samym prompcieZachowuje asynchroniczny przepływ zadań, pozwalając na sukces bez URL-i mediów

ElevenLabs

ElevenLabs Dialogue V3

Audio

Model dialogu wielogłosowego ElevenLabs w Rivya. Jest zbudowany do generowania mowy opartej na rolach, z osobnym przypisaniem głosu, kontrolą stabilności i tempem gotowym do dialogu dla podcastów, wywiadów i scen postaci.

Dlaczego go wybrać

Generowanie dialogu wielogłosowego

Najlepsze do
Wstępy podcastów z dwoma prowadzącymi i segmenty debat
Wejście
Tekst
Wyjście
Audio
Kredyty
Kredyty zależne od czasu trwania lub długości
Osobne przypisanie głosu do każdej postaciRegulowana stabilność dla spójnej interpretacji

ElevenLabs

ElevenLabs Turbo 2.5

Audio

Szybki model text-to-speech ElevenLabs w Rivya. Dzięki niskolatencyjnemu generowaniu głosu oraz regulowanej stabilności, podobieństwu, stylowi i szybkości jest zbudowany do szybkich szkiców voiceoveru i interaktywnych projektów TTS.

Dlaczego go wybrać

Najszybszy ElevenLabs TTS - zoptymalizowany pod niską latencję

Najlepsze do
Voice-overy do dem produktu i przewodników po aplikacji
Wejście
Tekst
Wyjście
Audio
Kredyty
Kredyty zależne od czasu trwania lub długości
Regulowana stabilność, podobieństwo, styl i szybkośćWiele presetów głosu z generowaniem świadomym kontekstu

ElevenLabs

ElevenLabs Multilingual V2

Audio

Wielojęzyczny model text-to-speech ElevenLabs w Rivya, obsługujący około 30 języków z automatycznym wykrywaniem. To mocniejsza opcja do lokalizacji, dostarczania między językami i bardziej naturalnych wielojęzycznych voiceoverów.

Dlaczego go wybrać

Automatycznie wykrywa i generuje około 30 języków

Najlepsze do
Zlokalizowane dema produktu i filmy onboardingowe
Wejście
Tekst
Wyjście
Audio
Kredyty
Kredyty zależne od czasu trwania lub długości
Ludzka intonacja i niuanse tonalneTe same ustawienia głosu: stabilność, podobieństwo, styl i szybkość

ElevenLabs

ElevenLabs Sound Effect V2

Audio

Model text-to-sound ElevenLabs w Rivya do krótkich efektów, przejść i zapętlonych warstw ambience. Generuj klipy audio od 0,5 do 22 sekund z regulowanym wpływem promptu, trybem pętli i 19 formatami wyjściowymi do projektów edycyjnych, produktowych albo growych.

Dlaczego go wybrać

Konfigurowalny czas audio od 0,5 do 22 sekund

Najlepsze do
Kliknięcia UI, dźwięki powiadomień i sygnały informacji zwrotnej w aplikacji
Wejście
Tekst
Wyjście
Audio
Kredyty
Kredyty zależne od czasu trwania lub długości
Regulowana siła wpływu promptuTryb pętli do bezszwowo powtarzanego audio

ElevenLabs

ElevenLabs Audio Isolation

Audio

Model ElevenLabs do oczyszczania dźwięku i izolacji głosu w Rivya. Prześlij jedno nagranie, aby odizolować wokal, usunąć szum tła i oczyścić mowę przed edycją albo publikacją.

Dlaczego go wybrać

Izolacja audio przez przesłanie pliku - prompt nie jest potrzebny

Najlepsze do
Czyszczenie nagrań wywiadów lub podcastów przed edycją
Wejście
Referencja / Audio
Wyjście
Audio
Kredyty
Kredyty zależne od czasu trwania lub długości
Separacja wokalu i usuwanie szumu tłaRozliczanie według czasu trwania audio

Masz już kilka modeli wartych próby?

Wybierz krótką listę tutaj, a potem testuj modele w Rivya bez przełączania aplikacji, portfeli czy historii projektu.
6 kredytów za rejestrację
Szybka rejestracja