
如果這次 run 真的是從 text 開始,而不是 still image 或既有 footage,先從 Seedance 1.5 Pro 開始。
這是目前 Rivya 裡最安全的 text-to-video default。當真正優先事項變成 flagship finish、更緊的 shot logic,或更便宜的 first-run testing 時,它才不再是最佳答案。
我們評估了什麼
這份指南已在 2026 年 4 月 28 日,針對 Rivya 內 text-start video jobs 複核。除非是為了解釋什麼時候 text-to-video 不是正確起點,否則不把 image-first 和 source-video-first workflows 混進來。
我們檢查了:
- 哪些 live Rivya video models 可以合理地從 text 開始
- duration、aspect ratio、native audio 和 quality settings 如何改變 first-run decision
- 每個選項是否更適合 cheap learning、broad marketing motion、product proof 或 finish pressure
- 相關文件:Video Workflows 和 Model Fields and Parameters
本頁解決的是更窄的 Video Choice
這份指南依據 Rivya 在 2026 年 4 月 21 日的即時 text-to-video-capable 目錄整理。
- 已交叉核對的公開路徑:
/video、/ai-models、/video,以及目前上線且 expose text-to-video 的 model pages - 已檢視的相關產品指南:Video Workflows in Rivya、Current Live Features in Rivya,以及 References and Uploads in Rivya
- 本頁只討論 Rivya 內 text-first video starts,不是全網 video model ranking
這裡有用的問題不是「誰贏得 text to video?」
而是「這是哪一種 text-first run,以及第一次認真生成結束時,必須有什麼成立?」
四條最佳 Text-First 起始路徑
| Model | Best for | Why it is the right first path | When not to start here |
|---|---|---|---|
| Seedance 1.5 Pro | broad text-to-video default | 平衡 text-first quality、實用 iteration comfort 與 native audio-video output | 當工作已經要求 premium finish 或最低成本 early test 時,不是第一選擇 |
| Veo3.1 Quality | premium finish pressure | 當 prompt 已描述接近完成的 clip 時,能提供更高階的 motion feel | 當 cost comfort 比 polish 更重要時,不是第一選擇 |
| Kling 3.0 | shot-planned video briefs | 對 duration、structure 和 multi-shot sequencing 有更強控制 | 當你只想要最安全的 broad default 時,不是第一選擇 |
| Sora 2 | low-risk text-first validation | 用更輕的路徑測試 text-only direction 是否值得更多投入 | 當第一次認真 run 就需要 launch-ready 時,不是第一選擇 |
這不是同一個答案的四種版本。它們代表四種不同 text-first jobs。
依 Prompt 已經知道的內容選擇
大多數 text-to-video 決策,只要先問 brief 裡已經鎖定了什麼,就會變簡單。
真正切分通常是:
- prompt 很廣,需要一條可靠的 all-around path
- prompt 已經像 finish-pass brief
- prompt 依賴 sequence、timing 和 shot structure
- prompt 仍是 low-cost experiment
這種 framing 比尋找 universal winner 更有用。
哪個模型適合哪種 Text-Only 工作
當你需要一條認真的 text-to-video default,且仍能承載 audio 和 finish quality 而不變脆,從 Seedance 1.5 Pro 開始。
當 text brief 已經像 premium launch film、product reveal 或 brand clip,而且你願意更早為 polish 付費,移到 Veo3.1 Quality。
當困難點不只是 taste,而是 sequence design:multiple beats、duration planning 或更清楚的 shot-by-shot plan,選 Kling 3.0。
當第一個問題仍然是 text-only direction 是否值得保留,使用 Sora 2。
Example Starting Briefs
Seedance 1.5 Pro
當你想要一個廣義、認真的 text-first 起點時使用。
Generate a 6-second product teaser of a ceramic coffee grinder on a kitchen counter, slow push-in camera, warm morning light, subtle sound cues, premium retail tone.Veo3.1 Quality
當 text prompt 已經需要 finish-pass feel 時使用。
Generate an 8-second luxury fragrance film: the bottle rises from black water, controlled reflections, slow cinematic orbit, premium launch mood, elegant background audio.Kling 3.0
當 clip 結構和 style 同樣重要時使用。
Generate a 10-second multi-shot launch clip for a portable projector: opening hero shot, close-up on the lens, living-room use scene, clean ad pacing, optional audio off.Sora 2
當最安全的第一步仍然是學習時使用。
Generate a 5-second text-to-video test of a paper lantern drifting upward in a dark courtyard, soft warm light, simple upward camera follow, low-risk first run.First Run 之後要判斷什麼
第一次有用的 review 通常不是「哪個品牌贏了?」
而是:
- prompt 裡的 scene logic 是否真的成立
- motion 是否刻意,而不是 generic
- 結果仍然明顯是 draft,還是已經接近 deliverable
- 這個階段的 cost 是否合理
- 下一步應該繼續 text-only,還是改成 still-led 或 reference-led video
這些訊號比 model leaderboard 更有用。
什麼時候要離開本頁
如果出現下列情況,本頁就不再是最佳答案:
- run 其實是從 still image 或 references 開始
- 任務是在轉換既有 footage
- audio 是主要限制,而不是 nice-to-have
- 工作已經足夠窄,可以進入 marketing clip 或 product demo decision
下一步去哪裡
- 如果真正任務是 marketing 或 campaign work,閱讀 AI Video Generator for Marketing。
- 如果真正任務是 product reveal 或 feature walk-through,閱讀 AI Product Demo Video Generator。
- 如果 audio 是主要限制,閱讀 AI Video Generator With Audio。
- 如果你想看 broader ranking,而不是 text-only cut,閱讀 Best AI Video Generator in 2026。
- 如果你需要相關 workflow guides,閱讀 Video Workflows in Rivya 和 References and Uploads in Rivya。
撰寫 Text-First Video Test Brief
如果 run 從 text 開始,prompt 必須承擔更多 production plan。
Include:
- scene 和 subject
- camera movement
- duration 和 aspect ratio
- pacing 和 motion priority
- audio 是 required 還是 optional
- 什麼會讓 first draft 值得 second pass
目標不是寫最長的 prompt,而是給模型足夠 structure,證明 text-only generation 是否是正確起點。
判斷 Text-Only 是否足夠
第一個結果出來後,判斷問題是否仍然屬於 text-to-video 頁。
檢查:
- scene logic 是否成立
- motion 是否跟隨 prompt,還是變得 generic
- first seconds 是否有用
- still image 或 reference asset 是否會讓下一輪更強
- cost level 是否符合 idea 的階段
如果 clip 需要 visual anchoring,移到 image-led 或 reference-led workflow。如果 text-only 成立,保存結果,並從最強 frame 或 motion beat 改進 brief。


