Dokumentace Rivya AI

Průvodce audio workflow AI v Rivya

Vybírejte audio workflow Rivya pro hlas, převod textu na řeč, dialog, zvukové efekty, čištění, hudební drafty, kredity a iteraci ve Studiu.

Naposledy zkontrolováno 2026/04/28

Tento průvodce audio workflow AI použijte dřív, než si v Rivya vyberete mezi hlasem, převodem textu na řeč, dialogem, zvukovými efekty, čištěním, hudebními drafty nebo prací nejprve s textem písně.

Nejjednodušší způsob, jak v Rivya použít audio špatně, je myslet si, že "audio" je jedno workflow.

Není.

Současná kategorie audia ve skutečnosti pokrývá několik různých druhů práce vedle sebe.

Tato stránka je workflow reference pro oblast audia. Pokud chcete spíš rozhodovací průvodce tím, jak začít první skutečnou hlasovou nebo zvukovou úlohu, lepší doplňkové čtení je Jak začít první AI audio workflow v Rivya.

Část, které se většina uživatelů dotkne jako první, je zatím stále mluvené audio: hlas, vícejazyčné čtení, dialog, zvukové efekty a čištění. Katalog už ale obsahuje i živou hudební větev postavenou kolem Suno Music, Suno Sounds a Suno Lyrics, takže je kategorie širší než "TTS plus čištění audia."

Začněte tvarem úlohy

Než zvolíte audio model, rozhodněte, který z těchto problémů opravdu řešíte:

  • hlas jednoho mluvčího nebo vyprávění
  • vícejazyčný mluvený výstup
  • dialog více mluvčích
  • generované zvukové efekty
  • čištění nahrané nahrávky
  • draft celé písně nebo instrumentální track od začátku
  • ideace textu písně před generováním audia

To jsou různá workflow, ne jedno workflow s mírně odlišnými nastaveními.

Co současný audio katalog opravdu pokrývá

Současný audio katalog dnes pokrývá dva různé clustery.

Hlas, dialog, zvukové efekty a čištění

Hudba a práce kolem hudby

Důležité není to, že několik z nich náhodou sedí pod stejnou kategorií. Důležité je, že patří k různým tvarům formulářů a různým vzorcům nákladů.

Mluvený hlas a vyprávění

Pokud je úlohou jeden hlas čtoucí jeden scénář, ElevenLabs Turbo 2.5 je stále čistý výchozí bod.

Je to nejlepší místo, kde začít pro:

  • vyprávění
  • voice-over
  • rychlé TTS drafty
  • jednoduché mluvené stopy

Pokud má mluvený výstup fungovat napříč jazyky, ElevenLabs Multilingual V2 je vhodnější.

Pokud scénář už obsahuje dva nebo více mluvčích, ElevenLabs Dialogue V3 je lepší cesta, protože dialog je strukturálně jiný než čtení jednou osobou.

Pokud už víte, že úloha je užší než celá oblast hlasu, odpovídající rozhodovací stránky jsou Nejlepší generátor převodu textu na řeč v roce 2026 pro prosté čtení, AI generátor vyprávění pro vysvětlování jedním mluvčím a AI generátor dabingu pro lokalizované nebo nahrazené mluvené stopy.

Zvukový design a čištění

Pokud je úlohou "vygenerovat zvuk", relevantní cesta je ElevenLabs Sound Effect V2.

Pokud je úlohou "opravit tuto nahrávku, kterou už mám", správná volba je ElevenLabs Audio Isolation.

Na tomto rozdílu záleží, protože první možnost je generování od promptu, zatímco druhá je čištění od uploadu.

Živá hudební větev

Hudební část audio katalogu je už živá, ale záměrně užší než plná sada pro hudební produkci.

Pokud je cílem struktura písně, ideace vedená textem nebo výstup ve stylu hudby, pomáhá začít z hudební části audio katalogu místo z hlasových průvodců.

Suno Music je pro první drafty tracků

Suno Music je lepší cesta, když potřebujete hratelný draft tracku s vokály nebo bez nich.

Díky tomu je nejjasnějším začátkem pro:

  • první drafty písní
  • instrumentální koncept tracky
  • hrubou hudbu pro videa, dema nebo podcasty

Úspěšné výsledky mohou pokračovat přes Extend Music a aktuální navazující akce nad výsledkem zahrnují také převod na WAV a oddělení vokálů.

Suno Sounds je pro krátké zvukové skici

Suno Sounds je vhodnější, když je skutečnou úlohou kratší zvuková skica, ambientní podklad, nápad na loop nebo textura pozadí, ne kompletní struktura písně.

Je užitečnějším místem pro začátek, když BPM, tónina nebo loopování znamenají víc než sloky a refrény.

Úspěšné výsledky mohou pokračovat do akce Vocal Separation.

Suno Lyrics je pro slova před audiem

Suno Lyrics je cesta nejdřív přes slova.

Je užitečná, když hook, název, směr refrénu nebo tvar sloky záleží dřív, než utratíte kredity za generování tracku. Důležitá hranice je, že vrací textové výsledky, ne hratelné audio.

Pokud chcete hudební větev rozepsanou podrobněji, přečtěte si hudební workflow v Rivya.

Proč se formuláře tolik mění

Audio povrch je záměrně tvarovaný podle modelu.

Formuláře se liší, protože se liší úlohy:

  • hlasové modely chtějí text
  • dialogové modely chtějí tahy a přiřazení mluvčích
  • zvukové efekty chtějí vstup podobný zvukovému cue
  • čisticí modely očekávají nahrané audio
  • hudební modely přinášejí vlastní promptové vzorce a navazující akce
  • nástroje nejdřív pro text písně mohou vracet strukturovaný text místo mediálních souborů

To není nekonzistence. Je to Rivya, která ukazuje skutečný tvar každého workflow místo předstírání, že všechno funguje stejně pod jedním formulářem.

Co hudební větev není

Správný popis současné hudební větve je "živá a užitečná, ale záměrně úzká."

Není to:

  • plný DAW
  • hluboká sada pro mastering nebo multi-stem editaci
  • celá rodina Suno vystavená najednou
  • důvod brát veškerou audio práci jako hudební práci

Na této hranici záleží, protože současná síla Rivya je pořád širší multimodální workflow, ne specializovaný hudební stack.

Proč audio náklady působí jinak

Audio práce v Rivya se nechová vždy jako generování obrázků s pevnou cenou.

Cena může mnohem příměji záviset na proměnných, jako jsou:

  • délka scénáře
  • délka výstupu
  • délka nahraného audia
  • navazující akce nad výsledkem u hudebních úloh

Některé audio položky, zejména v živé hudební větvi, jsou dokumentované s pevnou cenou za běh. Jiné se chovají spíš jako cenové vzorce podle délky nebo textu.

Proto se u audio modelů obzvlášť vyplatí číst credits hint. V mnoha případech popisuje nákladový vzorec, ne slib jednoho plochého čísla.

Nejčastější audio chyby

Nejčastější špatné odbočky jsou:

  • zvolit hlas, když je skutečnou úlohou čištění
  • zacházet s dialogem jako s vyprávěním jednoho mluvčího
  • zvolit zvukové efekty, když je skutečnou úlohou opravit existující nahrávku
  • začít se Suno Sounds, když je skutečnou potřebou draft celé písně
  • začít se Suno Lyrics, když je skutečnou potřebou hratelný výsledek
  • ignorovat délku nebo navazující akce jako součást nákladového obrazu

Většina těchto chyb zmizí, jakmile nejdřív roztřídíte úlohu podle tvaru workflow.

Rychlý způsob výběru

Pokud chcete nejkratší spolehlivou rozhodovací cestu:

  1. rozhodněte, zda vstupem je text, strukturovaný dialog, nahrané audio, hudební brief nebo textový brief
  2. rozhodněte, zda výstupem je hlas, vícejazyčný hlas, dialog, zvukový design, čištění, celý track, krátká zvuková skica nebo text písně
  3. zvolte odpovídající model
  4. teprve potom dolaďte parametry nebo navazující akce nad výsledkem

Tato posloupnost zabrání většině špatných shod dřív, než utratíte čas nebo kredity.

Veřejné audio stránky vs Studio

Veřejné audio stránky použijte, když chcete první běh, rychlé porovnání nebo vyhledávací landing page, která vás dostane do správné větve.

Studio použijte, když chcete opakovanou iteraci, uloženou kontinuitu, širší kontext účtu nebo stabilnější místo pro pokračování stejné audio úlohy.

Pokud chcete další nejužitečnější doprovodné čtení, pokračujte na hudební workflow v Rivya, Jak vytvořit AI hudbu s Rivya, Jak začít první AI audio workflow v Rivya, AI generátor vyprávění, AI voiceover pro videa, AI generátor dabingu nebo Průvodce Rivya Studio.

Checklist audio workflow

Začněte tady, když je vstupem nebo výstupem zvuk:

  • Rozhodněte, zda je úloha hlas, dialog, zvukový efekt, čištění, hudba nebo text písně.
  • Oddělte generování nového audia od opravy nahraného audia.
  • Před doručením zkontrolujte hlas, jazyk, počet mluvčích a komerční kontrolu.
  • Před utrácením za delší nebo rizikovější audio úlohy použijte kratší drafty.
  • Držte scénáře a poznámky k výslovnosti odděleně od obecného kreativního směru.

Znovu kontrolujte, když audio změní tvar

Znovu kontrolujte, když se voiceover změní na dabing, hudební nápad na psaní textu nejdřív, nebo čištění na nové nahrání. Audio úlohy rychle ujedou, pokud není pojmenovaný jejich tvar.

Obsah