Rivya AI Docs

คู่มือการอัปโหลดเสียงใน Rivya

เตรียมการอัปโหลดเสียงใน Rivya สำหรับการทำความสะอาดเสียง การแยกเสียงพูด การตรวจทานเสียง การพากย์ การแปลภาษา การตรวจต้นฉบับ ความปลอดภัยของไฟล์ และการลองใหม่

ใช้คู่มือนี้เมื่อเวิร์กโฟลว์เสียงของ Rivya เริ่มจากไฟล์บันทึกที่มีอยู่ ไฟล์เสียง คลิปต้นฉบับ หรือแอสเซ็ตเสียงพูด

การอัปโหลดเสียงสามารถรองรับการทำความสะอาดเสียง การแยกเสียงพูด การตรวจทานเสียง การพากย์ การแปลภาษา หรือเวิร์กโฟลว์วิดีโอ/เสียงที่ไฟล์ต้นฉบับมีความสำคัญ

เมื่อใดควรอัปโหลดเสียง

อัปโหลดเสียงเมื่องานขึ้นอยู่กับไฟล์ที่มีอยู่

ตัวอย่าง:

  • ทำความสะอาดไฟล์บันทึกที่มีเสียงรบกวน
  • แยกเสียงพูด
  • เตรียมเสียงต้นฉบับสำหรับเวิร์กโฟลว์ต่อเนื่อง
  • ตรวจทานทิศทางของเสียงพูด
  • ทำงานจากแอสเซ็ตเสียงพูดที่มีอยู่

หากคุณกำลังสร้างเสียงพูดใหม่จากสคริปต์ คุณอาจไม่จำเป็นต้องอัปโหลดเสียง

เตรียมไฟล์

ก่อนอัปโหลด ให้ตรวจสอบ:

  • รูปแบบไฟล์
  • ขนาดไฟล์
  • ไฟล์บันทึกครบถ้วนหรือไม่
  • เสียงพูดสำคัญได้ยินชัดหรือไม่
  • เสียงรบกวนพื้นหลังเป็นส่วนหนึ่งของปัญหาหรือไม่
  • คุณมีสิทธิ์ใช้ต้นฉบับหรือไม่

ไฟล์ต้นฉบับคุณภาพต่ำอาจจำกัดสิ่งที่เวิร์กโฟลว์สามารถปรับปรุงได้

อธิบายงานเสียง

อย่าอัปโหลดเสียงโดยไม่อธิบายงาน

คำสั่งที่มีประโยชน์รวมถึง:

  • ทำความสะอาดเสียงรบกวนพื้นหลัง
  • แยกเสียงผู้พูดหลัก
  • ปรับปรุงความชัดเจน
  • ใช้สิ่งนี้เป็นบริบทต้นฉบับ
  • ตรวจทานจังหวะการพูด
  • เตรียมสำหรับการแปลภาษา

ยิ่งงานชัดเจนเท่าไร การตรวจทานผลลัพธ์ก็ยิ่งง่ายขึ้น

ตรวจทานผลลัพธ์จากเสียงที่อัปโหลด

หลังประมวลผล ให้ฟังเพื่อดู:

  • ความชัดเจนของเสียงพูด
  • artifact จากการลดเสียงรบกวน
  • คำที่หายไป
  • น้ำเสียงที่เปลี่ยนไป
  • ปัญหาระดับเสียง
  • ปัญหาด้านจังหวะเวลา
  • ผลลัพธ์ดีกว่าต้นฉบับหรือไม่

สำหรับงานสำคัญ ให้ฟังทั้งไฟล์ตั้งแต่ต้นจนจบ

เช็กลิสต์การอัปโหลดเสียง

ก่อนส่งไฟล์เสียงเข้าเวิร์กโฟลว์ของ Rivya ให้ตรวจสอบ:

  • ตรวจชนิดไฟล์ ขนาดไฟล์ คุณภาพต้นฉบับ และเวิร์กโฟลว์รองรับการอัปโหลดเสียงหรือไม่
  • ตัดสินใจว่าไฟล์นั้นเป็นต้นฉบับสำหรับทำความสะอาด เสียงพูดสำหรับแยก เสียงอ้างอิง หรือวัสดุสำหรับตรวจทาน
  • ลบเนื้อหาอ่อนไหวหรือไม่จำเป็นออกก่อนอัปโหลด
  • เก็บไฟล์ต้นฉบับไว้จนกว่าจะตรวจทานผลลัพธ์ที่ประมวลผลแล้ว
  • เปรียบเทียบผลลัพธ์กับต้นฉบับก่อนแทนที่หรือแชร์

เป้าหมายคือทำให้อินพุตเสียงปลอดภัย ชัดเจน และตรวจทานได้ก่อนเริ่ม generation

เมื่ออินพุตไฟล์ต้องแก้ไขใหม่

แก้ไขอินพุตใหม่เมื่อไฟล์ที่อัปโหลดมีขนาดใหญ่เกินไป มีเสียงรบกวนมากเกินไป อ่อนไหวเกินไป ไม่รองรับโดยเวิร์กโฟลว์ที่เลือก หรือไม่ชัดเจนว่าควรควบคุมอะไร

ในกรณีเหล่านี้ ให้แก้ไฟล์หรือเลือกเวิร์กโฟลว์ที่เหมาะกว่า ก่อนใช้เครดิตกับการลองสร้างผลลัพธ์

ข้อผิดพลาดที่พบบ่อยในการอัปโหลด

หลีกเลี่ยงรูปแบบเหล่านี้ก่อนส่งเสียงเข้าเวิร์กโฟลว์:

  • อัปโหลดไฟล์ที่มีเสียงรบกวนโดยไม่บอกว่าต้องการทำความสะอาด แยกเสียง หรือวิเคราะห์
  • ใช้ไฟล์บันทึกส่วนตัว ทั้งที่การทดสอบเดียวกันทำได้ด้วยเสียงตัวอย่างที่ปลอดภัยกว่า
  • คาดหวังให้โมเดลเสียงพูดแก้สคริปต์ที่ไม่ดี
  • แทนที่ไฟล์บันทึกต้นฉบับก่อนตรวจทานเวอร์ชันที่ประมวลผลแล้ว

หากต้นฉบับมีความสำคัญ ให้เก็บไฟล์ต้นฉบับไว้และเปรียบเทียบผลลัพธ์ที่ประมวลผลแล้วอย่างระมัดระวัง

หน้าที่เกี่ยวข้อง

สารบัญ