
如果你的任务是替换或本地化一条口播音轨,先试 ElevenLabs Multilingual V2。
只有当这条“配音”不再是一个人把同一段内容换一种语言说出来,而是多人对白场景时,这个答案才会换掉。
这篇解决的是一个更窄的音频本地化问题
这篇内容按 2026 年 4 月 21 日 Rivya 当前公开语音路径整理。
- 核对过的公开入口包括:
/audio、/ai-models,以及当前公开语音模型页 - 对照过的相关产品指南包括:Rivya 的音频工作流、Rivya 的视频工作流 和 Rivya 里的参考文件与上传
- 这篇只讨论 Rivya 音频层里的口播替换和本地化,不承诺完整口型同步视频本地化
这里更值得先分清的,不是“哪种语言”。
而是“这次配音到底是哪一种替换任务”。
3 条最关键的配音路径
| 配音任务 | 更适合的第一站 | 为什么这样选 |
|---|---|---|
| 一个人、同一段内容、跨语言交付 | ElevenLabs Multilingual V2 | 真正难点是语言迁移和口播连续性 |
| 一个人、一个简单替换读稿 | ElevenLabs Turbo 2.5 | 很多任务其实比“配音”这个词听上去更简单 |
| 一段场景里有多个说话者 | ElevenLabs Dialogue V3 | 轮流说话和角色结构比单个声音更重要 |
这 3 条路径彼此相邻,但并不能互相代替。
先按替换形状来选
如果核心问题是把一条口播自然地迁移到另一种语言,同时保持整体连续性,就用 ElevenLabs Multilingual V2。
如果任务其实很简单,只是一个说话者、一个语种、一次干净的替换读稿,那 ElevenLabs Turbo 2.5 往往更直接。
如果输出已经不再是一条单独口播,而是一段带多个人物的对白场景,就直接切到 ElevenLabs Dialogue V3。
这是避免配音任务走错分支最快的办法。
这篇不承诺什么
在 Rivya 当前产品里,更准确地说,“配音”指的是音频层里的口播替换和本地化。
这篇不承诺:
- 完整口型同步视频翻译
- 时间线级的视频编辑
- 对上传画面自动做人嘴匹配修正
如果你的真实需求是一个音画一起成立的成片视频,更合适的搭配页是 AI 视频旁白 / 配音怎么选?、带音频的 AI 视频生成器怎么选? 和 Rivya 的视频工作流。
一个更快的配音选择顺序
如果你想最快走对路,更稳的顺序通常是:
- 先判断输出到底是同脚本跨语言、单人简单替换,还是多人对白配音
- 如果真正难点是语言迁移,先试 ElevenLabs Multilingual V2
- 如果任务只是一个干净的单人替换读稿,先试 ElevenLabs Turbo 2.5
- 如果脚本本身像一段场景,切到 ElevenLabs Dialogue V3
下一步去哪一页
- 如果真实任务是单人旁白,继续看 AI 解说 / 旁白生成器怎么选?。
- 如果真实任务是给视频加语音旁白,继续看 AI 视频旁白 / 配音怎么选?。
- 如果真实任务是生成一条原生带音频的视频,继续看 带音频的 AI 视频生成器怎么选?。
- 如果你要看更宽的工作流说明,直接读 Rivya 的音频工作流、Rivya 的视频工作流 和 Rivya 里的参考文件与上传。
在 Rivya 里准备配音 brief
第一次运行前,先把替换任务写清楚:
- 来源:判断你是在替换已有口播音轨,还是从文本创建本地化读稿。
- 说话者形状:标明这是单人、单次简单替换,还是多人场景。
- 语言备注:写清目标语言、人名、产品词、发音和语速约束。
- 输出用途:判断这版是给内部审核、直接发布、交给视频流程,还是做本地化批次。
第一版有用结果应该先证明配音形状选对了,再扩展到更多语言或更多声音。
按“替换结果”审核配音
试听时重点看目标语言音频是否仍然保留同一条信息、角色、发音和节奏。
如果语言迁移不对,先改语言和发音备注。如果说话者结构不对,先换分支,再添加风格词。如果草稿已经接近可用,先保存到历史记录,再继续做语言变体。


