Docs Rivya AI

Panduan Alur Kerja Audio AI Rivya

Pilih alur kerja audio Rivya untuk suara, teks ke ucapan, dialog, efek suara, pembersihan, draf musik, credits, dan iterasi Studio.

Terakhir ditinjau pada 2026/04/28

Gunakan panduan alur kerja audio AI ini sebelum memilih antara suara, teks ke ucapan, dialog, efek suara, pembersihan, draf musik, atau pekerjaan yang dimulai dari lirik di Rivya.

Cara paling mudah memakai audio dengan keliru di Rivya adalah menganggap "audio" sebagai satu alur kerja.

Bukan begitu.

Kategori audio saat ini sebenarnya mencakup beberapa jenis pekerjaan yang berjalan berdampingan.

Halaman ini adalah referensi alur kerja untuk area audio. Jika Anda menginginkan panduan yang lebih berorientasi keputusan tentang cara memulai tugas suara atau bunyi pertama yang nyata, Cara Memulai Alur Kerja Audio AI Pertama Anda di Rivya adalah bacaan pendamping yang lebih tepat.

Saat ini, bagian yang paling mungkin disentuh pengguna terlebih dahulu masih audio lisan: suara, pembacaan multibahasa, dialog, efek suara, dan pembersihan. Namun katalog juga sudah memiliki cabang musik yang tersedia dan dibangun di sekitar Suno Music, Suno Sounds, dan Suno Lyrics, jadi kategori ini lebih luas daripada "TTS plus pembersihan audio."

Mulai Dari Bentuk Tugas

Sebelum memilih model audio, tentukan masalah mana yang sebenarnya ingin Anda selesaikan:

  • suara atau narasi satu pembicara
  • output ucapan multibahasa
  • dialog multi-pembicara
  • efek suara yang dihasilkan
  • pembersihan rekaman yang diunggah
  • draf lagu penuh atau track yang dimulai dari instrumental
  • ideasi lirik sebelum generasi audio

Itu adalah alur kerja yang berbeda, bukan satu alur kerja dengan sedikit pengaturan berbeda.

Apa Saja Yang Dicakup Katalog Audio Saat Ini

Katalog audio saat ini mencakup dua kelompok berbeda.

Suara, dialog, efek suara, dan pembersihan

Musik dan pekerjaan yang berdekatan dengan musik

Poin pentingnya bukan bahwa beberapa model kebetulan berada di kategori yang sama. Poinnya adalah model-model itu memiliki bentuk formulir dan pola biaya yang berbeda.

Suara Lisan dan Narasi

Jika tugasnya adalah satu suara membacakan satu skrip, ElevenLabs Turbo 2.5 masih menjadi default yang bersih.

Itu adalah tempat terbaik untuk mulai membuat:

  • narasi
  • voice-over
  • draf TTS cepat
  • track ucapan sederhana

Jika penyampaian lisan harus bekerja lintas bahasa, ElevenLabs Multilingual V2 lebih sesuai.

Jika skrip sudah memiliki dua pembicara atau lebih, ElevenLabs Dialogue V3 adalah jalur yang lebih baik karena dialog berbeda secara struktur dari pembacaan satu orang.

Jika Anda sudah tahu tugasnya lebih sempit daripada seluruh area suara, halaman keputusan pendampingnya adalah Generator Teks ke Ucapan Terbaik pada 2026 untuk pembacaan biasa, Generator Narasi AI untuk penjelasan satu pembicara, dan Generator Dubbing AI untuk rekaman lisan yang dilokalkan atau diganti.

Desain Suara dan Pembersihan

Jika tugasnya adalah "hasilkan sebuah bunyi," ElevenLabs Sound Effect V2 adalah jalur yang relevan.

Jika tugasnya adalah "perbaiki rekaman yang sudah saya miliki," ElevenLabs Audio Isolation adalah jalur yang tepat.

Perbedaan itu penting karena yang pertama adalah generasi berbasis prompt, sedangkan yang kedua adalah pembersihan berbasis unggahan.

Cabang Musik Live

Sisi musik dalam katalog audio sudah live, tetapi sengaja lebih sempit daripada suite produksi musik lengkap.

Jika tujuannya adalah struktur lagu, ideasi yang dipandu lirik, atau output bergaya musik, lebih membantu untuk mulai dari sisi musik katalog audio, bukan dari panduan suara.

Suno Music untuk draf track pertama

Suno Music adalah jalur yang lebih baik saat Anda membutuhkan draf track yang bisa diputar, dengan atau tanpa vokal.

Itu menjadikannya titik mulai paling jelas untuk:

  • draf lagu pertama
  • track konsep yang dimulai dari instrumental
  • musik kasar untuk video, demo, atau podcast

Hasil yang berhasil dapat dilanjutkan melalui Extend Music, dan tindak lanjut berbasis hasil saat ini juga mencakup konversi WAV dan pemisahan vokal.

Suno Sounds untuk sketsa suara pendek

Suno Sounds lebih sesuai ketika pekerjaan sebenarnya adalah sketsa sonik yang lebih pendek, alas ambience, ide loop, atau tekstur latar, bukan struktur lagu lengkap.

Ini adalah tempat yang lebih berguna untuk mulai ketika BPM, key, atau kemampuan loop lebih penting daripada verse dan chorus.

Hasil yang berhasil dapat dilanjutkan ke aksi Vocal Separation.

Suno Lyrics untuk kata sebelum audio

Suno Lyrics adalah jalur yang dimulai dari kata.

Ini berguna ketika hook, judul, arah chorus, atau bentuk verse perlu dipastikan sebelum Anda mengeluarkan biaya untuk generasi track. Batas pentingnya adalah alat ini mengembalikan hasil teks, bukan audio yang dapat diputar.

Jika Anda ingin cabang musik dijelaskan lebih detail, baca Alur Kerja Musik di Rivya.

Mengapa Formulirnya Sangat Berbeda

Permukaan audio sengaja mengikuti bentuk model.

Formulirnya berbeda karena tugasnya berbeda:

  • model suara meminta teks
  • model dialog meminta giliran bicara dan penetapan pembicara
  • efek suara meminta input generasi seperti cue
  • model pembersihan mengharapkan audio yang diunggah
  • model musik memperkenalkan pola prompt dan aksi lanjutan tersendiri
  • alat yang dimulai dari lirik dapat mengembalikan teks terstruktur, bukan file media

Itu bukan inkonsistensi. Itu adalah Rivya yang menampilkan bentuk nyata setiap alur kerja, alih-alih berpura-pura semuanya bekerja dengan cara yang sama di bawah satu formulir.

Apa Yang Bukan Termasuk Cabang Musik

Cara yang tepat untuk menjelaskan cabang musik saat ini adalah "live dan berguna, tetapi sengaja sempit."

Ini bukan:

  • DAW lengkap
  • suite mastering mendalam atau pengeditan multi-stem
  • seluruh keluarga Suno yang dibuka sekaligus
  • alasan untuk memperlakukan semua pekerjaan audio sebagai pekerjaan musik

Batas itu penting karena kekuatan Rivya saat ini masih ada pada alur kerja multimodal yang lebih luas, bukan stack khusus musik saja.

Mengapa Biaya Audio Terasa Berbeda

Pekerjaan audio di Rivya tidak selalu berperilaku seperti generasi gambar berbiaya tetap.

Biaya bisa jauh lebih langsung bergantung pada variabel seperti:

  • panjang skrip
  • durasi output
  • durasi audio yang diunggah
  • aksi lanjutan berbasis hasil pada tugas musik

Beberapa entri audio, terutama pada cabang musik live, didokumentasikan dengan harga tetap per run. Yang lain lebih menyerupai pola biaya berbasis durasi atau panjang teks.

Karena itu, credits hint sangat layak dibaca pada model audio. Dalam banyak kasus, teks itu menjelaskan pola biaya, bukan menjanjikan satu angka datar.

Kesalahan Audio Yang Paling Umum

Pilihan keliru yang paling umum adalah:

  • memilih suara ketika tugas sebenarnya adalah pembersihan
  • memperlakukan dialog seperti narasi satu pembicara
  • memilih efek suara ketika tugas sebenarnya adalah memperbaiki rekaman yang sudah ada
  • memulai dari Suno Sounds ketika kebutuhan sebenarnya adalah draf lagu penuh
  • memulai dari Suno Lyrics ketika kebutuhan sebenarnya adalah hasil yang bisa diputar
  • mengabaikan durasi atau aksi lanjutan sebagai bagian dari gambaran biaya

Sebagian besar kesalahan itu hilang setelah Anda mengurutkan tugas berdasarkan bentuk alur kerja terlebih dahulu.

Cara Cepat Memilih

Jika Anda menginginkan jalur keputusan paling singkat yang tetap andal:

  1. tentukan apakah inputnya teks, dialog terstruktur, audio yang diunggah, brief musik, atau brief lirik
  2. tentukan apakah outputnya suara, suara multibahasa, dialog, desain suara, pembersihan, track penuh, sketsa suara pendek, atau teks lirik
  3. pilih model yang cocok
  4. baru setelah itu atur parameter atau aksi lanjutan berbasis hasil

Urutan ini mencegah sebagian besar kecocokan yang buruk sebelum Anda menghabiskan waktu atau credits.

Halaman Audio Publik vs Studio

Gunakan halaman audio publik saat Anda menginginkan run pertama, perbandingan cepat, atau landing page pencarian yang membawa Anda ke cabang yang tepat.

Gunakan Studio saat Anda menginginkan iterasi berulang, kontinuitas tersimpan, konteks akun yang lebih lengkap, atau tempat yang lebih stabil untuk terus mendorong tugas audio yang sama.

Jika ingin pendamping yang paling berguna berikutnya, buka Alur Kerja Musik di Rivya, Cara Membuat Musik AI dengan Rivya, Cara Memulai Alur Kerja Audio AI Pertama Anda di Rivya, Generator Narasi AI, Voiceover AI untuk Video, Generator Dubbing AI, atau Panduan Rivya Studio.

Daftar Periksa Alur Kerja Audio

Mulai dari sini saat input atau outputnya adalah bunyi:

  • Tentukan apakah pekerjaannya adalah suara, dialog, efek suara, pembersihan, musik, atau lirik.
  • Pisahkan generasi audio baru dari perbaikan audio yang diunggah.
  • Periksa suara, bahasa, jumlah pembicara, dan tinjauan komersial sebelum pengiriman.
  • Gunakan draf yang lebih pendek sebelum mengeluarkan biaya untuk tugas audio yang lebih panjang atau lebih berisiko.
  • Pisahkan skrip dan catatan pengucapan dari arahan kreatif umum.

Periksa Ulang Saat Audio Berubah Bentuk

Periksa ulang ketika voiceover berubah menjadi dubbing, ide musik berubah menjadi penulisan yang dimulai dari lirik, atau pembersihan berubah menjadi rekaman ulang. Tugas audio cepat bergeser jika bentuk pekerjaannya tidak dinamai.

Daftar Isi