
Nếu công việc là thêm một track nói vào video, hãy bắt đầu với ElevenLabs Turbo 2.5.
Câu trả lời đó thay đổi khi cùng một voice-over phải hoạt động qua nhiều ngôn ngữ, hoặc clip không còn là một phần một người nói.
Trang này nói về lớp track nói
Hướng dẫn này bám theo các lane âm thanh và video đang hoạt động của Rivya tại ngày 21 tháng 4 năm 2026.
- các đường dẫn công khai đã đối chiếu:
/audio,/video,/ai-models, và các trang mô hình giọng nói đang hoạt động - các hướng dẫn sản phẩm liên quan đã rà soát: Quy trình âm thanh trong Rivya, Quy trình video trong Rivya, và Tệp tham chiếu và tải lên trong Rivya
- trang này chỉ nói về cách chọn lộ trình track nói cho video voice-over, không phải dubbing, chỉnh sửa timeline hay tạo video âm thanh gốc
Câu hỏi hữu ích không phải là "đây có phải cho video không?"
Mà là "video này thật sự cần kiểu track nói nào?"
Ba lộ trình voice-over video
| Công việc voice-over video | Lộ trình đầu tiên phù hợp nhất | Vì sao phù hợp |
|---|---|---|
| một người nói dẫn toàn bộ clip | ElevenLabs Turbo 2.5 | mặc định sạch nhất cho video giải thích, walkthrough và lời dẫn sản phẩm |
| cùng một track phải hoạt động qua nhiều ngôn ngữ | ElevenLabs Multilingual V2 | lộ trình tốt hơn khi bản địa hóa trở thành phần khó |
| clip hoạt động như một cảnh có lời thoại | ElevenLabs Dialogue V3 | tốt hơn khi nhiều người nói và lượt nói qua lại là điều quan trọng |
Các lộ trình này có liên quan, nhưng không nên bắt đầu từ cùng một giả định.
Chọn theo cấu trúc clip
Dùng ElevenLabs Turbo 2.5 khi một narrator hoặc một giọng hướng dẫn dẫn toàn bộ clip.
Dùng ElevenLabs Multilingual V2 khi video đã hoạt động, nhưng cùng một lớp nói bây giờ phải chịu được chuyển đổi ngôn ngữ.
Dùng ElevenLabs Dialogue V3 khi kịch bản nghe ít giống voice-over hơn và giống một cảnh có nhiều người nói hơn.
Đó là cách nhanh nhất để giữ voice-over video không trôi sang nhánh sai của stack.
Trang này không hứa điều gì
Trang này không hứa:
- video dubbing đồng bộ khẩu hình đầy đủ
- chỉnh sửa video ở cấp timeline
- âm thanh gốc được tạo trực tiếp bên trong mô hình video
Nếu yêu cầu thật sự là thay lời nói trên media có sẵn, hãy xem Trình tạo lồng tiếng AI.
Nếu yêu cầu thật sự là một clip được tạo ra nơi chuyển động và âm thanh hoạt động cùng nhau, hãy xem Trình tạo video AI có âm thanh.
Thứ tự quyết định voice-over video nhanh hơn
Nếu bạn muốn thứ tự ngắn nhất nhưng vẫn đáng tin, hãy dùng cách này:
- quyết định clip cần một người nói, cùng một người nói qua nhiều ngôn ngữ, hay một cảnh có lời thoại
- nếu một giọng dẫn toàn bộ clip, bắt đầu với ElevenLabs Turbo 2.5
- nếu bản địa hóa là phần khó, chuyển sang ElevenLabs Multilingual V2
- nếu kịch bản hoạt động như một cảnh, chuyển sang ElevenLabs Dialogue V3
Đi đâu tiếp theo
- Nếu tác vụ thật sự là lời dẫn một người mà không có ngữ cảnh video mạnh, hãy đọc Trình tạo narration AI.
- Nếu tác vụ thật sự là thay lời nói hoặc bản địa hóa, hãy đọc Trình tạo lồng tiếng AI.
- Nếu tác vụ thật sự là clip được tạo có âm thanh gốc, hãy đọc Trình tạo video AI có âm thanh.
- Nếu bạn cần các hướng dẫn quy trình liên quan, hãy đọc Quy trình âm thanh trong Rivya, Quy trình video trong Rivya, và Tệp tham chiếu và tải lên trong Rivya.
Chuẩn bị voice-over theo clip
Trước khi tạo voice-over, hãy viết brief bám vào video, không chỉ bám vào kịch bản:
- Vai trò clip: video giải thích, product walkthrough, quảng cáo, tutorial, teaser ra mắt hoặc review nội bộ.
- Timing: thời lượng dự kiến, khoảng dừng, vị trí CTA và mọi khoảnh khắc hình ảnh mà giọng nói không được che mất.
- Hình dạng người nói: một narrator, narrator bản địa hóa hoặc một cảnh có nhiều người nói.
- Bàn giao: âm thanh này sẽ được tải xuống, khớp trong dựng phim, tái sử dụng cho biến thể hay ghép với một lần chạy video khác.
Lần chạy hữu ích đầu tiên nên kiểm tra xem track nói có khớp với clip không trước khi bạn tạo biến thể theo kênh hoặc ngôn ngữ.
Rà soát voice-over trong ngữ cảnh video
Hãy nghe đồng thời với việc kiểm tra cấu trúc video: track nói nên khớp với thứ tự cảnh, nhịp, timing CTA và khoảnh khắc sản phẩm.
Nếu âm thanh tốt nhưng timing clip sai, hãy sửa ghi chú timing thay vì đổi mô hình giọng nói. Nếu kịch bản cần lượt nói thật sự giữa nhiều người hoặc tạo video âm thanh gốc, hãy chuyển sang trang hẹp hơn trước khi tiếp tục.


