AI モデルカタログ

クレジットを使う前に、画像、動画、音声、チャットモデルを比較

タスク、入力、出力、プロバイダー、クレジット情報別に 95+ 個の AI モデルを閲覧できます。各モデルの得意分野と実例を確認し、候補を Rivya で実際に試せます。
サインアップで 6 クレジット
すばやく登録
画像動画音声オーディオチャット

モデルカタログ

タスク、入力、出力からモデルを探す

モダリティ、入力タイプ、プロバイダー、強み、クレジット情報で絞り込めます。モデルページを開くと、実際の出力、タスク適性、簡単なオンライン試用を確認できます。

4 種類のモデルタイプ

すべてのモデル

モデル、ベンダー、機能、タスクで検索できます。詳細ページをすべて開かなくても、実データに基づくフィルターで絞り込めます。

95 件のモデル候補

候補リストに入れる前に、入力、出力、クレジット、サンプルの確認ポイントを比較できます。

モデル適性を比較

Rivya が各モデルに対してすでに追跡しているフィールド、つまりモダリティと対応入力で絞り込めます。タスク適性はモデルコンテンツソースからカードに表示されます。

クレジットの手がかり

クレジットガイドは、カタログコンテンツから各モデルカードに表示されます。

モダリティ

対応入力

95 件のモデル候補

候補リストに入れる前に、入力、出力、クレジット、サンプルの確認ポイントを比較できます。

4 種類のモデルタイプすべて

最初に試しやすいモデル

ここから開始

Alibaba

Z-Image

画像

Alibaba の軽量 text-to-image モデルです。5 つのアスペクト比に対応した高速な単一画像生成で、わずか 1 credit で素早いコンセプトドラフトやソーシャルメディア用ビジュアルに使えます。

選ぶ理由

1 回の生成につき 1 credit という最小コスト

最適
安価な初回ビジュアルコンセプト
入力
テキスト
出力
画像
クレジット
1回の生成につき 1 credit から
高速な単一画像出力で素早く反復できる5 つのアスペクト比プリセットを備えたシンプルな text-to-image

Google

Nano Banana

画像

Googleの柔軟な画像モデルです。テキスト-to-画像と画像-to-画像、11種類のアスペクト比、最大10枚の参照画像、PNG/JPEG出力に対応しています。ポートレート、商品構図、より広いランディングページ用ビジュアルに適しています。

選ぶ理由

超ワイド21:9と自動モードを含む11種類のアスペクト比

最適
複数の視覚参照を使う商品構図
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1回の生成あたり3クレジットから
誘導作成用に最大10枚の参照画像PNGとJPEGの出力形式オプション

Black Forest Labs

Flux 2 Pro

画像

Black Forest Labs の 320 億パラメータ級フラッグシップです。テキストから画像生成と画像から画像生成に対応し、最大 8 枚の参照画像、2K 解像度、正確なテキスト描画を備えています。製品写真やブランドビジュアル向けに作られています。

選ぶ理由

フォトリアルな質感で最大 2K 解像度

最適
製品スチルと EC のヒーロー画像
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1 回の生成あたり 5 クレジットから
画像内のテキストやロゴを正確に描画スタイルやキャラクターの一貫性を保つ最大 8 枚の参照画像

OpenAI

GPT-5.5

チャット

Rivya で使える OpenAI の高度な GPT チャットモデルです。ブリーフにより多くの余地が必要なときの複雑な推論、画像対応分析、リサーチ統合、構造化された文章作成に向いています。

選ぶ理由

複雑な推論と複数ステップ分析に高い上限

最適
長い、または整理しにくい資料パケットをまたぐリサーチ統合
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
最大 6 枚の画像を使う画像対応チャットをサポート構造化ブリーフ、リサーチ統合、意思決定文書に適している

OpenAI

GPT-5.4

チャット

Rivya で使える OpenAI の上位 AI チャットモデルです。より複雑な分析や文章作成タスクに向けて、構造化入力の扱い、推論制御、ツール志向の会話プロジェクトが強化されています。

選ぶ理由

より強い複雑分析と複数ステップ計画

最適
長い戦略ブリーフと意思決定メモ
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
最大 6 枚の画像に対応する画像理解構造化タスクとツール志向の会話に適している

OpenAI

GPT-5.4 Codex

チャット

Rivya で使える OpenAI の上位 Codex モデルです。要求の高いリポジトリ規模の開発プロジェクトに向けて、より強いコーディング、構造化推論、ツール志向の協業を備えています。

選ぶ理由

上位 Codex の推論とコーディング協業

最適
リポジトリ規模のデバッグとアーキテクチャレビュー
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
Responses API プロジェクトに対応複雑なコード、ツール利用、複数ステップの技術作業に適している

OpenAI

GPT-5.3 Codex

チャット

Rivya で使える OpenAI の最新かつ最も高性能な Codex モデルです。最先端のコード生成とより深いエージェント型推論を組み合わせ、最も要求の高い開発プロジェクトに対応します。

選ぶ理由

OpenAI の最も高性能なコードモデル

最適
大きなコードベースでの難しいデバッグ
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
最先端のコード生成品質複雑な問題向けの最も深い推論

OpenAI

GPT-5.2

チャット

Rivya で使える OpenAI のフラッグシップ AI チャットモデルで、高度な推論、最大 6 枚の画像に対応する画像理解、20K 文字のコンテキストウィンドウを備えています。リサーチ、計画、文章作成、画像を踏まえた分析に使える強力な汎用 GPT 選択肢です。

選ぶ理由

高度な推論と複雑な分析

最適
戦略メモと意思決定文書
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
画像理解に対応 - 最大 6 枚の画像を分析20K 文字のコンテキストウィンドウ

OpenAI

GPT-5.2 Codex

チャット

Rivya で使える OpenAI のより高度な Codex モデルで、複雑なエンジニアリングタスク向けの推論が強化されています。単純なコード生成だけでは足りない、長期的なエージェント型コーディング、アーキテクチャ判断、大きなリファクタリングに最適化されています。

選ぶ理由

複雑なエンジニアリング向けのより強い推論

最適
アーキテクチャレビューとシステム設計のトレードオフ
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
システム設計とアーキテクチャに最適包括的なコード生成向けの 12K 出力トークン

OpenAI

GPT-5.1 Codex

チャット

Rivya で使える OpenAI のアップグレード版 Codex モデルです。エージェント型コーディングタスク向けに、コード精度と推論が強化されています。同じ長文出力、リポジトリ認識型プロジェクトを保ちながら、複数ファイルのリファクタリングとより安全なコード編集を改善しています。

選ぶ理由

GPT-5 Codex より改善されたコード精度

最適
複数ファイルのリファクタリングと移行
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
複数ファイルのリファクタリングにより強い長いコード生成向けの 12K 出力トークン上限

OpenAI

GPT-5 Codex

チャット

Rivya で使える OpenAI のコード特化 GPT-5 Codex モデルです。画像理解に対応し、デバッグ、実装計画、リファクタリング、技術的な問題解決に向いています。

選ぶ理由

12K 出力トークン上限を持つコード特化モデル

最適
コードレビューとバグ修正
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
コード生成とデバッグに最適化スクリーンショットや図の分析向けの画像理解

Google

Gemini 3.1 Pro

チャット

Rivya で使える Google の最新かつ最も高性能な Gemini AI チャットモデルです。上位レベルの推論、画像理解、指示追従を備えており、要求の高い分析タスクやクリエイティブタスクに最も強い Gemini 選択肢です。

選ぶ理由

Google の最も高性能な Gemini モデル

最適
長文コンテキストのリサーチ資料と比較作業
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
上位レベルの推論と指示追従最大 6 枚の画像に対応する画像理解

Google

Gemini 3 Pro

チャット

Rivya で使える Google の深度の高い Gemini AI チャットモデルです。Gemini 2.5 Pro より強い推論と画像理解を備えており、リサーチ統合、技術文書、より慎重なマルチモーダル分析に向いています。

選ぶ理由

Gemini 2.5 Pro より強化された推論

最適
長文分析と構造化された推奨
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
最大 6 枚の画像に対応する画像理解リサーチ統合と技術文書に強い

Google

Gemini 3 Flash

チャット

Rivya で使える Google の次世代高速 AI チャットモデルです。Gemini 2.5 Flash よりさらに低いトークンコストと強化された推論を備えており、大量のマルチモーダルチャット、スクリーンショットのトリアージ、素早いアシスタント作業向けに作られています。

選ぶ理由

全チャットモデルの中で最も低いトークン価格

最適
素早いマルチモーダルトリアージとスクリーンショット分析
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
Gemini 2.5 Flash より改善された推論最大 6 枚の画像に対応する画像理解

Google

Gemini 2.5 Pro

チャット

Rivya で使える Google のより高度な Gemini AI チャットモデルです。Flash より強い推論、画像理解、20K コンテキストを備えており、2 クレジットでリサーチ統合、文書分析、構造化された文章作成により適しています。

選ぶ理由

Gemini Flash より強い推論

最適
リサーチ統合と分析的な文章作成
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
画像理解に対応 - 最大 6 枚の画像を分析1 回 2 クレジットのバランス型コスト

Google

Gemini 2.5 Flash

チャット

Rivya で使える Google の最速かつ最も手頃な AI チャットモデルです。1 回 1 クレジットで、最大 6 枚の画像に対応する画像理解を備えており、すばやい Q&A、初回要約、スクリーンショットのトリアージ、日常的な AI 支援に適しています。

選ぶ理由

1 クレジットで使える最も低コストなチャットモデル

最適
すばやいリサーチ確認と初回要約
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
リアルタイム会話向けの高速応答画像理解に対応 - 最大 6 枚の画像を分析

Anthropic

Claude Opus 4.7

チャット

Rivya で使える Anthropic のフラッグシップ Claude チャットモデルです。深い推論、慎重な統合、エグゼクティブ向け文書、高い影響を持つテキスト作業に適しています。

選ぶ理由

フラッグシップ級のテキスト推論と統合

最適
エグゼクティブ向けメモと取締役会向けのナラティブ
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
長文分析と慎重な文章作成に強く合うRivya の現在のフロントエンドではテキスト優先の Claude プロジェクトとして使える

Anthropic

Claude Opus 4.6

チャット

Rivya で使える Anthropic のフラッグシップ Claude AI チャットモデルです。要求の高い重要プロジェクトで、深い推論、複雑な分析、高品質な文章作成に向けて設計されています。

選ぶ理由

フラッグシップ級の推論と複雑な分析

最適
エグゼクティブ向けメモと重要度の高いナラティブ作成
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
長文理解と出力品質に高い上限を持つRivya の現在のフロントエンドではテキスト優先の Claude プロジェクトとして使える

Anthropic

Claude Sonnet 4.6

チャット

Rivya で使える Anthropic のバランス型 Claude AI チャットモデルです。Opus レベルの費用まで上げずに、コンテンツ、リサーチ、コーディングプロジェクト向けの強い長文推論と慎重な分析を維持します。

選ぶ理由

バランスの取れた品質で信頼できる推論

最適
長いブリーフ、PRD、戦略文書のレビュー
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
長文理解と複数ターンでの安定性に強いRivya の現在のフロントエンドではテキスト優先の Claude プロジェクトとして使える

Anthropic

Claude Opus 4.5

チャット

Rivya で使える Anthropic のフラッグシップ Claude AI チャットモデルです。深い推論、複雑な分析、専門家レベルの文章作成に優れており、重要な AI タスク向けの上位選択肢です。

選ぶ理由

Anthropic の最も高性能なモデル

最適
深いリサーチ統合と難しい分析
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
深い推論と複雑な分析に優れている専門家レベルの文章作成とコンテンツ品質

Anthropic

Claude Sonnet 4.5

チャット

Rivya で使える Anthropic のバランス型 Claude AI チャットモデルです。ニュアンスのある文章作成、慎重な分析、安全性を意識した応答に強く、コンテンツ作成やリサーチ向けの有力な Claude 選択肢です。

選ぶ理由

ニュアンスのある文章作成と慎重な分析

最適
編集リライトとトーンに配慮した文章作成
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
安全性を意識した、よく調整された応答Rivya の現在のフロントエンドではテキスト優先の Claude プロジェクトとして使える

Anthropic

Claude Haiku 4.5

チャット

Rivya で使える Anthropic の軽量な Claude AI チャットモデルです。Claude らしいトーンを保ちながら上位モデルほどの支出を抑えたい高頻度プロジェクト向けに、速度、コスト効率、安定した日常チャット性能へ調整されています。

選ぶ理由

低レイテンシで高頻度の利用に向いている

最適
受信箱の仕分けとすばやい社内 Q&A
入力
テキスト
出力
テキスト / 推論
クレジット
従量課金 - 使用量に応じてクレジットを消費
Sonnet や Opus よりトークン単価が大幅に安いRivya の現在のフロントエンドではテキスト優先の Claude プロジェクトとして使える

Alibaba

Z-Image

画像

Alibaba の軽量 text-to-image モデルです。5 つのアスペクト比に対応した高速な単一画像生成で、わずか 1 credit で素早いコンセプトドラフトやソーシャルメディア用ビジュアルに使えます。

選ぶ理由

1 回の生成につき 1 credit という最小コスト

最適
安価な初回ビジュアルコンセプト
入力
テキスト
出力
画像
クレジット
1回の生成につき 1 credit から
高速な単一画像出力で素早く反復できる5 つのアスペクト比プリセットを備えたシンプルな text-to-image

Google

Nano Banana 2

画像

Google の次世代画像モデルです。4K 解像度、極端な 8:1 を含む 15 種類のアスペクト比、Google Search グラウンディング、最大 14 枚の参照画像に対応し、Rivya で最も柔軟な画像生成モデルです。

選ぶ理由

最大 4K 解像度(1K / 2K / 4K を選択可能)

最適
大判画像コンセプトとパノラマ風レイアウト
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1 回の生成あたり 5 クレジットから
極端な 8:1 と 1:8 のパノラマを含む 15 種類のアスペクト比実世界の文脈に使える Google Search グラウンディング

Google

Nano Banana Pro

画像

Googleのプレミアム画像モデルです。4K出力、11種類のアスペクト比、最大8枚の参照画像に対応し、優れたディテールと色精度で、高忠実度のブランドおよびキャンペーンビジュアル向けに最適化されています。

選ぶ理由

忠実度を高めた最大4K解像度

最適
プレミアムなブランドビジュアルと上位のマーケティング画像
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1回の生成あたり8クレジットから
自動検出オプション付きの11種類のアスペクト比ブランド一貫性のための最大8枚の参照画像

Google

Nano Banana

画像

Googleの柔軟な画像モデルです。テキスト-to-画像と画像-to-画像、11種類のアスペクト比、最大10枚の参照画像、PNG/JPEG出力に対応しています。ポートレート、商品構図、より広いランディングページ用ビジュアルに適しています。

選ぶ理由

超ワイド21:9と自動モードを含む11種類のアスペクト比

最適
複数の視覚参照を使う商品構図
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1回の生成あたり3クレジットから
誘導作成用に最大10枚の参照画像PNGとJPEGの出力形式オプション

OpenAI

GPT Image 2

画像

Rivya で使える OpenAI の新しい GPT Image モデルです。テキストから画像生成、画像から画像生成、最大 16 枚の参照画像、明確な 1K / 2K / 4K クレジットティアに対応しています。

選ぶ理由

1 つの Rivya モデルページでテキストから画像生成と画像から画像生成に対応

最適
高解像度の製品ビジュアルとキャンペーンビジュアル
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1 回の生成あたり 3 クレジットから
1K、2K、4K 解像度ティアで予算をより明確に制御構造化された編集ブリーフ向けに最大 16 枚の参照画像

OpenAI

GPT Image 1.5

画像

OpenAI の画像モデルで、Medium / High の品質ティアと最大 16 枚の参照画像に対応します。複雑な指示への追従と、正確な空間関係を持つ一貫したシーン描画に優れています。

選ぶ理由

最大 16 枚の参照画像 - Rivya で最も高い上限

最適
指示量の多い製品ビジュアルやキャンペーンビジュアル
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1 回の生成あたり 4 クレジットから
コスト制御向けの Medium と High 品質ティアOpenAI の言語モデル由来の優れたプロンプト理解

OpenAI

4o Image

画像

OpenAI の 4o Image モデルを、Rivya の専用テキスト入力からの画像生成パスとして使えるようになりました。現時点ではページ設定を意図的に絞り、プロンプトと対応済みの 3 種類のアスペクト比だけを、画像 1 枚あたり固定 3 クレジットで提供します。

選ぶ理由

他のモデルにまとめず、専用の OpenAI 4o Image 入口として使える

最適
テキストブリーフからすばやく作るコンセプトビジュアル
入力
テキスト
出力
画像
クレジット
生成あたり 3 クレジットから
画像 1 枚あたり 3 クレジットのテキスト入力からの画像生成フロー1:1、3:2、2:3 の 3 種類のアスペクト比を明示

ByteDance

Seedream 5.0 Lite

画像

ByteDanceの軽量なSeedream画像モデルです。テキスト画像生成と画像編集で共通の価格を使い、8種類のアスペクト比、最大14枚の参考画像に対応し、現在は1回の実行あたり6クレジットです。

選ぶ理由

テキスト画像生成と画像から画像生成のどちらも固定6クレジット

最適
参考画像を多く使うキャンペーンボードやムード方向の検討
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1回の生成あたり6クレジットから
ガイド付き編集プロジェクト向けに最大14枚の参考画像に対応超ワイド21:9を含む8種類のアスペクト比

ByteDance

Seedream 4.5

画像

ByteDanceの高精細画像モデルです。2K/4Kの品質段階、8種類のアスペクト比、最大14枚の参考画像に対応し、ファッションやライフスタイルのビジュアルで映画的な色調整と豊かな質感表現に強みがあります。

選ぶ理由

2K(Basic)と4K(High)の品質段階を選択可能

最適
ファッションやライフスタイルのキャンペーン画像
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1回の生成あたり7クレジットから
最大14枚の参考画像で制作をガイド超ワイド21:9を含む8種類のアスペクト比

ByteDance

Seedream 4.0

画像

Seedream 4.0は、Rivyaでテキスト画像生成、参考画像を使った編集、明確な出力コントロールに使える、バランス型のByteDance画像モデルです。

選ぶ理由

1つのモデル枠でテキスト画像生成と画像編集の両方を扱える

最適
ライフスタイルビジュアルと編集感のある画像ドラフト
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1回の生成あたり固定6クレジット
公開向けの`image_resolution`と`max_images`コントロールを見える形で残せる編集パスでは最大10枚の参考画像に対応

ByteDance

Seedream 3.0

画像

Seedream 3.0は、Rivyaで単独の旧世代画像モデルとして利用できます。現在は公開向けのテキストから画像生成だけを残しており、1回の実行あたり5クレジットです。

選ぶ理由

Seedream 3.0を独立した旧世代のテキスト画像生成項目として残せる

最適
旧世代Seedreamのビジュアル方向を残したいチーム
入力
テキスト
出力
画像
クレジット
1回の生成あたり固定5クレジット
公開ドキュメントに明確に示されているパラメータサブセットだけを公開新しいSeedreamオプションより設定項目が軽い

xAI

Grok Imagine

画像

強いクリエイティブ解釈力と 5 種類のアスペクト比を備えた xAI の画像モデルです。芸術的な表現や定番から外れたビジュアルスタイルに重きを置いた単一画像生成に向いています。

選ぶ理由

クリエイティブで芸術的な解釈力が強い

最適
大胆なコンセプトビジュアルと実験的なアートディレクション
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1 回の生成あたり 4 クレジットから
他のモデルとは異なる独自のビジュアルスタイルテキストから画像生成と画像から画像生成に対応

Black Forest Labs

Flux 2 Pro

画像

Black Forest Labs の 320 億パラメータ級フラッグシップです。テキストから画像生成と画像から画像生成に対応し、最大 8 枚の参照画像、2K 解像度、正確なテキスト描画を備えています。製品写真やブランドビジュアル向けに作られています。

選ぶ理由

フォトリアルな質感で最大 2K 解像度

最適
製品スチルと EC のヒーロー画像
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1 回の生成あたり 5 クレジットから
画像内のテキストやロゴを正確に描画スタイルやキャラクターの一貫性を保つ最大 8 枚の参照画像

Black Forest Labs

Flux 2 Flex

画像

Flux 2 ファミリーの編集重視バリアントです。最大 8 枚の参照画像と 2K 解像度に対応し、構造調整とスタイル転送に特化しています。既存ビジュアルを反復して整える作業に適しています。

選ぶ理由

画像編集とスタイル転送に最適化

最適
既存のキャンペーン画像や製品画像の編集
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1 回の生成あたり 14 クレジットから
最大 8 枚の参照画像を使ったガイド付き編集Flux 2 品質の 2K 解像度出力

Black Forest Labs

Flux Kontext Max

画像

Black Forest Labs の強化版 Flux Kontext モデルで、より要求の高いプロンプト指定の生成と画像編集タスクに向いています。Rivya では現在、テキストから画像生成と画像から画像生成を同じ非同期プロジェクトに置き、プラットフォームの現行ポリシーではどちらも 1 回あたり固定 8 クレジットで提供しています。

選ぶ理由

Rivya 上では生成と編集のどちらも固定 8 クレジット

最適
重要なキャンペーンスチルのキービジュアル調整
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1 回の生成あたり 8 クレジットから
より難しいプロンプトや編集タスク向けの上位 Kontext モデルテキストから画像生成と 1 枚画像の編集を扱う単一モデルのプロジェクト

Black Forest Labs

Flux Kontext Pro

画像

Black Forest Labs の低コストな Flux Kontext プロジェクトで、テキストから画像生成と単一画像編集に対応します。Rivya では現在、テキストから画像生成と画像から画像生成の両方を同じ非同期画像プロジェクトで公開しており、現行のプラットフォーム価格ポリシーではどちらのモードも固定 4 クレジットです。

選ぶ理由

Rivya 上では生成と編集のどちらも固定 4 クレジット

最適
承認済みの 1 枚の元画像から作る広告や SNS バリエーション
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1 回の生成あたり 4 クレジットから
テキストから画像生成と 1 枚画像の編集を扱う単一モデルのプロジェクト英語のみのプロンプト要件に対応する内蔵翻訳スイッチ

Alibaba

Qwen2 Image

画像

AlibabaのQwen2画像モデルは、現在Rivyaで1つの固定価格画像プロジェクトとして統合されています。テキスト-to-画像と画像-to-画像を安全にカバーし、両方の公開ドキュメントで共通して示されているアスペクト比のサブセット、PNG/JPEG出力、seed再利用、シンプルなNSFWスイッチを備えています。

選ぶ理由

テキスト-to-画像と画像-to-画像の両方で固定6クレジット価格

最適
中国語ポスターとキャンペーンビジュアル
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1回の生成あたり6クレジットから
テキスト実行では `qwen2/text-to-image`、参照画像実行では `qwen2/image-edit` を使用両方の公開Qwen2ドキュメントで共通する安全なアスペクト比サブセット

Alibaba

Qwen Image

画像

Alibaba Qwenファミリーの画像モデルです。HDプリセット(Square、Portrait、Landscape)とPNG/JPEG出力に対応し、中国語プロンプトと文化的なニュアンスを含むビジュアル生成に強みがあります。

選ぶ理由

HDプリセットサイズ:Square、Portrait 4:3/16:9、Landscape 4:3/16:9

最適
中国語マーケティングビジュアル
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1回の生成あたり4クレジットから
中国語プロンプトの理解に強いPNGとJPEGの出力形式オプション

Midjourney

Midjourney

画像

Midjourney の V7 画像モデルです。テキストから画像生成と画像から画像生成に対応し、Niji アニメモード、3 つの速度ティア(Relaxed/Fast/Turbo)、スタイル参照、Omni Reference による一貫性を備えています。映画的アート、イラスト、ムードボードでは今も業界基準です。

選ぶ理由

比類ない美的品質 — 業界基準

最適
映画的コンセプトアートとムードボード
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1 回の生成あたり 3 クレジットから
V7 + V6.1 + V6 + Niji 7/6 アニメモード3 つの速度ティア: Relaxed、Fast、Turbo

Recraft

Recraft Remove Background

画像

既存画像1枚から被写体を分離するための、Rivya上のRecraft背景除去モデルです。次の工程で透明アセット、きれいな切り抜き、または元の背景なしのソース画像が必要な場合に使用します。

選ぶ理由

固定1クレジット価格の単一目的切り抜きツール

最適
デザイン作業前に、商品、ポートレート、カタログ画像1枚から背景を除去する作業
入力
参照 / 画像
出力
画像
クレジット
1回の生成あたり1クレジットから
アップロード画像1枚を対象にし、通常はプロンプトが不要被写体の輪郭が読み取りやすい商品写真、ポートレート、その他アセットに適している

Recraft

Recraft Crisp Upscale

画像

承認済みの静止画1枚に、低コストでシャープさと明瞭度を加えるための、Rivya上のRecraftの軽量画像アップスケールモデルです。より重い納品品質のアップスケールではなく、選んだ画像に書き出し前の安い磨き込みだけが必要な場合に使用します。

選ぶ理由

アップロード画像1枚に対する固定1クレジットのクリーンアップ処理

最適
サムネイル、ソーシャル画像、小さな商品画像に素早く明瞭度を加える作業
入力
参照 / 画像
出力
画像
クレジット
1回の生成あたり1クレジットから
公開前や引き渡し前の素早いシャープ化と軽い拡大に適している必須プロンプトも管理すべきサイズ段階もないため、摩擦の少ない事前確認として使いやすい

Alibaba

Wan 2.7 Image Pro

画像

Alibaba の上位 Wan 2.7 画像モデルです。現在 Rivya では、text-to-image と画像編集向けの独立した画像枠として提供されています。生成を 1 枚の出力画像に明示的に絞ることで、価格は 1 回あたり 12 credits に固定されています。

選ぶ理由

text-to-image と image-to-image のどちらも固定 12 credits

最適
ブランドのキービジュアルやローンチキャンペーン用の静止画
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1回の生成につき 12 credits から
ガイド付き編集プロジェクト向けに最大 9 枚の参照画像を使えるWan 2.7 画像ファミリー内で、より明確なプレミアムティアとして扱える

Alibaba

Wan 2.7 Image

画像

Alibaba の標準 Wan 2.7 画像モデルです。Rivya では text-to-image と画像編集向けの独立した画像枠として提供され、現在は 1 回の実行につき 5 credits です。

選ぶ理由

現在は 1 回の実行につき 5 credits

最適
複数参照を使うソーシャル投稿やキャンペーンのドラフトボード
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1回の生成につき 5 credits から
text-to-image と image-to-image の両方に対応ガイド付き編集向けに最大 9 枚の参照画像を使える

Google

Google Imagen4 Ultra

画像

Google Imagen 4 Ultra は、Rivya のプレミアム Imagen テキストから画像生成ティアです。現在は固定 12 クレジットの単一画像プロジェクトとして統合されており、公開プロンプト、ネガティブプロンプト、アスペクト比、シード制御を備えています。

選ぶ理由

Rivya 上で固定 12 クレジット価格

最適
ホームページのヒーローアートとプレミアムキャンペーンビジュアル
入力
テキスト
出力
画像
クレジット
1 回の生成あたり 12 クレジットから
プレミアム Google Imagen テキストから画像生成ティアネガティブプロンプト、アスペクト比、シード制御

Google

Google Imagen4

画像

Google Imagen 4 は、Rivya の標準 Imagen テキストから画像生成ティアです。現在は固定 8 クレジットの単一画像プロジェクトとして統合されており、公開プロンプト、ネガティブプロンプト、アスペクト比、シード制御を備えています。

選ぶ理由

Rivya 上で固定 8 クレジット価格

最適
Web サイトのヒーローグラフィックとエディトリアルイラスト
入力
テキスト
出力
画像
クレジット
1 回の生成あたり 8 クレジットから
標準 Google Imagen テキストから画像生成ティアネガティブプロンプト、アスペクト比、シード制御

Google

Google Imagen4 Fast

画像

Google Imagen 4 Fast は、Rivya の軽量な Imagen テキストから画像生成ティアです。現在は単一画像プロジェクトを維持し、固定 4 クレジット価格を使い、複数画像出力を開かずに公開プロンプト、ネガティブプロンプト、アスペクト比、シード制御を提供しています。

選ぶ理由

Rivya 上で固定 4 クレジット価格

最適
ランディングページやブログのビジュアル方向性を素早く試す
入力
テキスト
出力
画像
クレジット
1 回の生成あたり 4 クレジットから
軽量な Google Imagen テキストから画像生成入口ネガティブプロンプト、アスペクト比、シード制御

Topaz

Topaz Image Upscaler

画像

Topaz Image Upscalerは、すでに承認済みの静止画を実際に大きくする必要がある場合に使う、Rivyaの納品品質向け画像アップスケーラーです。構図がすでに確定しており、残りの課題が書き出し解像度、レビュー用サイズ、印刷準備であるときに使います。

選ぶ理由

構図を再生成するのではなく、実際の納品サイズまで引き上げる必要がある承認済み静止画向け

最適
承認済みのEC、商品、キャンペーン静止画を、より大きな納品形式へアップスケールする作業
入力
参照 / 画像
出力
画像
クレジット
1回の実行あたり5クレジットから
factor 1、2、4、8に基づく明確なUI段階で、サイズとコストの判断がしやすい選ばれた静止画がすでに最終版で、出力サイズが本当に重要な場合はRecraft Crisp Upscaleより適している

Ideogram

Ideogram V3

画像

Ideogram V3 は、テキストレンダリング、ポスターレイアウト、デザイン重視の画像プロンプトに使う Rivya のテキストから画像生成モデルです。現在の価格は TURBO が 4 クレジット、BALANCED が 7 クレジット、QUALITY が 10 クレジットです。

選ぶ理由

レンダリング速度ティア: TURBO、BALANCED、QUALITY

最適
ポスターコンセプトやタイトル主導の広告グラフィック
入力
テキスト
出力
画像
クレジット
1 回の生成あたり 4 クレジットから
デザイン指向の Ideogram V3 画像生成MagicPrompt 拡張トグル

Ideogram

Ideogram V3 Reframe

画像

Ideogram V3 Reframe は現在、Rivya ではレンダリング速度ごとの価格を持つ単一画像のリフレーミングプロジェクトとして統合されています。現在の価格は TURBO が 4 クレジット、BALANCED が 7 クレジット、QUALITY が 10 クレジットです。

選ぶ理由

レンダリング速度ティア: TURBO、BALANCED、QUALITY

最適
承認済みの 1 枚のビジュアルを新しいアスペクト比に合わせる作業
入力
参照 / 画像
出力
画像
クレジット
1 回の生成あたり 4 クレジットから
単一画像のリフレーミングプロジェクトこのモデルではプロンプトは任意

Ideogram

Ideogram V3 Remix

画像

Ideogram V3 Remix は現在、Rivya ではレンダリング速度ごとの価格を持つ単一画像のリミックスプロジェクトとして統合されています。現在の価格は TURBO が 4 クレジット、BALANCED が 7 クレジット、QUALITY が 10 クレジットです。

選ぶ理由

レンダリング速度ティア: TURBO、BALANCED、QUALITY

最適
1 枚のソース画像から作る別方向のアートディレクション
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1 回の生成あたり 4 クレジットから
単一画像のリミックスプロジェクトMagicPrompt、強度、ネガティブプロンプトのコントロール

Ideogram

Ideogram Character

画像

承認済みの 1 枚のキャラクター画像を、新しいシーン、衣装、形式へ展開するためのキャラクター一貫性オプションです。広範な画像編集よりもアイデンティティ保持が重要で、1 回に 1 枚の出力画像だけが必要な場合に使います。

選ぶ理由

1 つのキャラクターを新しいシーンでも認識しやすく保つために調整された単一参照プロジェクト

最適
1 つのマスコット、アバター、またはイラストキャラクターを多くの新しいシーンで認識しやすく保つ作業
入力
テキスト / 参照 / 画像
出力
画像
クレジット
1 回の生成あたり 12 クレジットから
Ideogram V3、Reframe、Remix から分離されており、広範な編集自由度よりも一貫性を選びやすいTURBO、BALANCED、QUALITY のクレジットティアを備えた予測しやすい 1 枚画像出力

ByteDance

Seedance 2.0

動画

ByteDanceの完全版Seedance 2.0動画モデルです。プロンプトのみの生成、フレーム主導アニメーション、マルチモーダル参照生成に明示的に対応しています。Rivyaでは、フレーム入力とマルチモーダル参照が曖昧な1つのアップロード枠に崩れないよう、ドキュメント化された役割分割を明示したままにしています。

選ぶ理由

Seedance 2.0の完全なシーン分割:テキスト、フレーム、マルチモーダル参照

最適
プロンプト、フレーム、参照バンドルから作る、より高品質な短尺動画
入力
テキスト
出力
動画
クレジット
1回の実行あたり64クレジットから
プロンプト主導、フレーム主導、マルチモーダル参照プロジェクトを1つのモデル内で扱える480pと720p出力に、adaptiveアスペクト比サポート

ByteDance

Seedance 2.0 Fast

動画

ByteDanceのより高速なSeedance 2.0動画モデルです。プロンプトのみの生成、フレーム主導の画像アニメーション、マルチモーダル参照動画生成に対応する完全なシーンルーティングを備えています。Rivyaでは、最初/最後フレーム入力が参照画像、動画、音声の役割と衝突しないよう、ドキュメント化されたシーン分割を明示したままにしています。

選ぶ理由

Seedance 2.0 Fastの完全なシーン分割:テキスト、フレーム、マルチモーダル参照

最適
プロンプトまたはストーリーボードフレームから作る高速な広告プリビズ
入力
テキスト
出力
動画
クレジット
1回の実行あたり52クレジットから
480pと720p出力に、adaptiveアスペクト比サポート任意の同期音声生成と最終フレーム返却

ByteDance

Seedance 1.5 Pro

動画

ByteDanceのフラッグシップ動画モデルです。テキスト-to-動画と画像-to-動画、ネイティブ音声・映像同期、480p-1080p、4-12秒クリップ、6種類のアスペクト比、動的/固定レンズ制御、任意の音声生成、リップシンクに対応しています。

選ぶ理由

正確なリップシンクを備えたネイティブ音声・映像同期

最適
同期した会話と動きが必要な短いクリップ
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1回の生成あたり28クレジットから
480p / 720p / 1080pの解像度オプション4秒、8秒、12秒の設定可能なクリップ尺

ByteDance

Seedance 1.0 Pro

動画

ByteDanceのSeedance 1.0 Proモデルは、テキスト-to-動画と画像-to-動画の両方に対応する標準1.0 ProオプションとしてRivyaに公開されています。現在のページ設定は公開V1 Proドキュメントに合わせて、解像度、尺、カメラ固定、seed、安全チェックの操作を保っています。

選ぶ理由

テキスト-to-動画と画像-to-動画の両方に対応

最適
短い映画的クリップ
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1回の生成あたり25クレジットから
480p、720p、1080pの出力ティア5秒と10秒の尺操作

ByteDance

Seedance 1.0 Pro Fast

動画

ByteDanceの高速画像-to-動画モデルです。1枚の参照画像を720p/1080pの5秒または10秒クリップへアニメーション化します。静止画から素早く動画が必要な場合に速度重視で最適化されています。

選ぶ理由

画像-to-動画に特化 — 素早いターンアラウンド

最適
静止画から動画への素早いアニメーション化
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1回の生成あたり16-72クレジット
720pと1080pの解像度オプション5秒または10秒のクリップ尺

ByteDance

Seedance 1.0 Lite

動画

ByteDanceのSeedance 1.0 Liteモデルは、テキスト-to-動画と画像-to-動画の両方に対応する軽量な1.0オプションとしてRivyaに公開されています。公開V1 Liteパラメータセットに従い、現在はSeedance 1.0 Proより低い価格ラダーを使用しています。

選ぶ理由

テキスト-to-動画と画像-to-動画の両方に対応

最適
低コストのストーリーボードテスト
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1回の生成あたり16クレジットから
Seedance 1.0 Proより低い価格画像-to-動画モードで、任意の終了フレームとして2枚目の画像に対応

HappyHorse

HappyHorse 1.0

動画

Rivya 上でテキストから動画生成、単一画像からのモーション生成、複数画像参照の動画生成、動画編集を 1 つの公開モデルページから扱える柔軟な AI 動画モデルです。

選ぶ理由

1 つのモデルページでテキスト、画像、参照、動画編集ワークフローを扱える

最適
文章ブリーフから作る短い広告や製品モーションの下書き
入力
テキスト / 参照 / 画像 / 動画
出力
動画
クレジット
1 回の生成あたり 28 クレジットから
720p と 1080p の固定価格出力ティアに対応動画を添付しない場合は最大 9 枚の画像参照を受け付ける

Alibaba

Wan 2.7 Video

動画

Alibaba の新しい Wan 動画ラインで、解像度と長さで価格が決まります。Rivya では text-to-video、image-to-video、動画編集を 1 つのモデル枠で提供し、5秒の 720p は 80 credits からです。

選ぶ理由

解像度と長さで決まる価格:720p = 16 credits/秒、1080p = 24 credits/秒

最適
予算を抑えたい商品プロモーションやソーシャル向け短尺版
入力
テキスト / 参照 / 画像 / 動画
出力
動画
クレジット
1回の生成につき 80 credits から
text-to-video、image-to-video、動画編集を 1 つのモデル枠でサポートimage-to-video では 1 枚の画像、または最初と最後のフレームのペアを使える

Alibaba

Wan 2.6

動画

Alibaba の 3 モード Wan オプションを Rivya で使えます。text-to-video、image-to-video、ソース動画編集を 1 つのプロジェクトで扱います。720p/1080p、5〜15 秒のクリップ、そして一度に 1 枚の画像または 1 本のソース動画に対応します。

選ぶ理由

3 モード:text-to-video + image-to-video + video-to-video

最適
既存ソースクリップから始める video-to-video 編集
入力
テキスト / 参照 / 画像 / 動画
出力
動画
クレジット
1回の生成につき 70 credits から
テキストや静止画だけでなく、ソース動画からも始められる重めの Wan オプション画像 1 枚またはソース動画 1 本に絞ることで、編集パスが明確になる

Alibaba

Wan 2.5 Video

動画

Wan 2.5 は現在、Rivya 上で text-to-video と image-to-video を共通の入口として提供しています。現在の価格は `720p_5 = 60`、`720p_10 = 120`、`1080p_5 = 100`、`1080p_10 = 200` credits です。

選ぶ理由

text-to-video と image-to-video の両方を 1 つのモデル枠で扱える

最適
テキストまたは 1 枚のヒーロー画像から作る、5 秒または 10 秒の Wan プロモーションクリップ
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1回の生成につき 60 credits から
現在のビジネス価格は、解像度と長さを組み合わせた 4 つのティアで決まる新しい結果タイプを追加せず、既存の非同期動画結果チェーンを保てる

Alibaba

Wan 2.2 A14B Turbo

動画

Wan 2.2 A14B Turboは現在、Rivyaでテキスト動画生成、画像動画生成、さらに画像と音声を使った動画パスをカバーしています。現在の価格は、テキストまたは画像実行で`480p = 8`、`720p = 12`、1枚の画像と1本の音声クリップで結果を駆動する場合は`480p = 16`、`580p = 20`、`720p = 24`です。

選ぶ理由

1つのモデル枠で、テキスト、画像、画像+音声駆動の動画生成をカバー

最適
軽量なWanテキスト動画生成の試行
入力
テキスト / 参照 / 画像 / 音声
出力
動画
クレジット
1回の生成あたり8クレジットから
ビジネス価格は、軽めのテキスト/画像実行と重めの画像+音声駆動実行の間で段階化画像+音声駆動パスは、すべてをデフォルトに畳まず、独自の高度なパラメータ範囲を保持

Alibaba

Wan Animate Replace

動画

Rivya 上で使える Wan のキャラクター置き換え動画モデルです。既存クリップの動きはそのままに、画面に登場する人物や主体だけを差し替えたいときに使います。公開ソース動画 URL、公開された置き換え画像 URL、解像度ティアを指定して実行します。

選ぶ理由

プロンプト中心の別プロジェクトを作らず、公開インターフェースの `video_url + image_url + resolution` という形を保てる

最適
ソースクリップの動きを保ちながら、画面上の主体やキャラクターを置き換える作業
入力
動画
出力
動画
クレジット
1回の生成につき 12 credits から
元の動きを保ったまま主体やキャラクターを差し替える用途に向いている両方の素材が公開ストレージ上にあり、上流から取得できる状態だと扱いやすい

MiniMax

Hailuo 2.3

動画

Standard / Pro の品質ティア、768P / 1080P 解像度、6 秒または 10 秒のクリップに対応した MiniMax の画像から動画生成モデルです。静止画からより滑らかな動きと自然なトランジションを作れることで知られています。

選ぶ理由

Standard と Pro の品質ティア

最適
ポートレートやファッションの静止画をモーション化する作業
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1 回の生成あたり 25 クレジットから
768P と 1080P の解像度オプション6 秒または 10 秒の設定可能なクリップ長

MiniMax

Hailuo Pro

動画

MiniMax の旧版 Hailuo Pro 動画モデルを、テキストから動画生成と画像から動画生成の両方に使える固定 Pro ティアのモデルとして接続しています。画像モードでは 1 枚または 2 枚の参照画像を受け付け、2 枚目の画像はラストフレームとして使われます。現在は 1 回の生成あたり 57 クレジットです。

選ぶ理由

テキストから動画生成と画像から動画生成の両方に使える 1 つのモデル

最適
1 枚のキービジュアルから作る高品質なモーション下書き
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1 回の生成あたり 57 クレジット
画像モードではファーストフレーム、またはファーストフレームとラストフレームの組み合わせに対応公開情報で確認できる固定 Pro ティアで接続

MiniMax

Hailuo Standard

動画

MiniMax の旧版 Hailuo Standard 動画モデルを、テキストから動画生成と画像から動画生成の両方に使える 1 つのモデルとしてまとめています。画像モードでは 1 枚または 2 枚の参照画像を受け付け、2 枚目の画像はラストフレームとして使われます。現在確認できている公開価格ティアは 12 から 50 クレジットです。

選ぶ理由

テキストから動画生成と画像から動画生成の両方に使える 1 つのモデル

最適
1 枚のヒーロー静止画を短いモーションティザーに変換する作業
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1 回の生成あたり 12-50 クレジット
画像モードではファーストフレーム、またはファーストフレームとラストフレームの組み合わせに対応512P と 768P の画像起点ティア

Kuaishou

Kling 3.0

動画

テキストから動画生成と画像から動画生成に使える、Kuaishou のプレミアム動画モデルです。標準 (720P) / 高精細 (1080P) ティア、単一ショットまたはマルチショット構造、3〜15 秒の長さ、任意の音声生成、最大 2 枚の参照画像に対応します。

選ぶ理由

標準 (720P) と高精細 (1080P) の品質ティア

最適
明示的なショット設計が必要なストーリーボード風の広告プリビズ
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1 回の生成あたり 42 クレジットから
単一ショットまたはマルチショット生成モード柔軟な 3〜15 秒のクリップ長

Kuaishou

Kling 3.0 motion-control

動画

1 枚の参照画像と 1 本のモーション動画で 1 つの被写体を動かし、背景ソースも明示的に選べる新しい Kling モーション制御オプションです。モーション転送に加えて、最終シーンを動画由来にするか画像由来にするかを強く制御したい場合に使います。

選ぶ理由

厳密な 1 画像 + 1 モーション動画プロジェクトなので、アイデンティティと動きの役割が明確

最適
背景をモーション動画由来にするか参照画像由来にするかを選ぶ必要があるモーション転送
入力
テキスト / 参照 / 画像 / 動画
出力
動画
クレジット
1 回の生成あたり 20 クレジットから
キャラクターの向きに加えて `background_source` を追加しており、Kling 2.6 Motion Control からの主なアップグレードになっている標準 (720P) と高精細 (1080P) の固定価格が 20 / 27 クレジット

Kuaishou

Kling 2.6

動画

任意の音声生成、5 秒 / 10 秒のクリップ、3 種類のアスペクト比に対応した Kuaishou の動画モデルです。自然な物理表現を伴う人物の動きや表情豊かなキャラクターアニメーションに強みがあります。

選ぶ理由

動画と一緒に任意で音声生成が可能

最適
キャラクター演技や表情豊かな動き
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1 回の生成あたり 55 クレジットから
5 秒または 10 秒のクリップ長3 種類のアスペクト比: 1:1、16:9、9:16

Kuaishou

Kling 2.6 motion-control

動画

1 枚の参照画像と 1 本のモーション動画で 1 つの被写体を動かすための専用モーション転送プロジェクトです。より安い Kling のモーション制御パスを試したい場合や、Kling 3.0 Motion Control の追加シーン制御が不要な場合に使います。

選ぶ理由

厳密な 1 画像 + 1 モーション動画プロジェクトなので、何がアイデンティティを決め、何が動きを決めるかが明確

最適
静止したキャラクター画像と別のモーション参照クリップで 1 人のキャラクターを動かす作業
入力
テキスト / 参照 / 画像 / 動画
出力
動画
クレジット
1 回の生成あたり 16 クレジットから
Kling 3.0 Motion Control より低コストで、16 / 22 クレジットから開始可能任意のプロンプトにより、アップロードしたモーションクリップを主役のまま保てる

Kuaishou

Kling V2.5 Turbo Pro

動画

Kuaishou の Kling V2.5 Turbo Pro 動画モデルは、現在テキストから動画生成と画像から動画生成の両方に対応しています。公開価格の根拠は、テキストと画像の両方について 5 秒と 10 秒のティアを明確にカバーしているため、Rivya では 42 / 84 クレジットとして直接対応させています。

選ぶ理由

テキストと画像の両方のティアに明確な公開価格根拠がある

最適
テキストまたは先頭・末尾フレームから作る短尺広告プリビズ
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1 回の生成あたり 42〜84 クレジット
テキスト生成と画像生成が、整合した 1 つのモデル項目を共有画像モードでは先頭フレームと任意の末尾フレームに対応

Kuaishou

Kling V2.1 Master

動画

Kuaishou の旧世代 Kling V2.1 Master 動画モデルは、Rivya 上でテキストから動画生成と画像から動画生成の両方に対応しています。現在の価格は 5 秒で 160 クレジット、10 秒で 320 クレジットです。

選ぶ理由

5 秒と 10 秒の固定価格ティア

最適
旧世代 Kling Master と新しいティアの比較
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1 回の生成あたり 160〜320 クレジット
テキスト生成と画像生成が、整合した 1 つのモデル項目を共有テキストでは `aspect_ratio` を維持し、画像ではドキュメント根拠のあるフィールドだけを使用

Kuaishou

Kling V2.1 Pro

動画

Kuaishou の旧世代 Kling V2.1 Pro 画像から動画生成モデルは、先頭フレームと任意の末尾フレーム画像に対応しています。現在の価格は 5 秒で 50 クレジット、10 秒で 100 クレジットです。

選ぶ理由

画像から動画生成専用で、用途がより絞られている

最適
ビフォー/アフター、または開始フレームと終了フレームのショットテスト
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1 回の生成あたり 50〜100 クレジット
先頭フレームと任意の末尾フレームに対応5 秒と 10 秒の固定価格ティア

Kuaishou

Kling V2.1 Standard

動画

Kuaishou の旧世代 Kling V2.1 Standard 画像から動画生成モデルです。現在の価格は 5 秒で 25 クレジット、10 秒で 50 クレジットです。

選ぶ理由

画像から動画生成専用

最適
1 枚の商品静止画を短いモーションテストにする作業
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1 回の生成あたり 25〜50 クレジット
5 秒と 10 秒の固定価格ティア`negative_prompt` と `cfg_scale` に対応

Kuaishou

Kling AI Avatar Pro

動画

Kuaishou の Kling AI Avatar Pro は、1 枚のポートレート画像と 1 本の音声クリップからリップシンクしたアバター動画を生成する、より高品質なトーキングアバターモデルです。Rivya では現在、1 回の生成あたり固定 16 クレジットで提供しています。

選ぶ理由

ポートレート + 音声による固定の高品質トーキングアバタープロジェクト

最適
より高品質なトーキングアバター動画
入力
テキスト / 参照 / 画像 / 音声
出力
動画
クレジット
1 回の生成あたり 16 クレジット
Rivya では固定 16 クレジットの価格品質重視のリップシンク出力に向いている

Kuaishou

Kling AI Avatar Standard

動画

Kuaishou の Kling AI Avatar Standard は、1 枚のポートレート画像と 1 本の音声クリップからリップシンクしたアバター動画を生成するトーキングアバターモデルです。Rivya では現在、1 回の生成あたり固定 8 クレジットで提供しています。

選ぶ理由

ポートレート + 音声による固定のトーキングアバタープロジェクト

最適
トーキングアバター動画
入力
テキスト / 参照 / 画像 / 音声
出力
動画
クレジット
1 回の生成あたり 8 クレジット
Rivya では固定 8 クレジットの価格わかりやすいリップシンク経路

MeiGen-AI

Infinitalk

動画

Infinitalk は、ポートレートと音声を組み合わせるトーキング動画モデルです。現在の価格は解像度と音声の長さに応じて計算され、480p は 1 秒あたり 3 クレジット、720p は 1 秒あたり 12 クレジットです。

選ぶ理由

固定されたポートレート + 音声のトーキング動画プロジェクト

最適
トーキングアバター動画
入力
テキスト / 参照 / 画像 / 音声
出力
動画
クレジット
1 秒あたり 3 または 12 クレジット
クレジットは解像度と検証済み音声長に連動480p と 720p の出力ティアに対応

Runway

Runway

動画

Runwayは、テキスト-to-動画と画像-to-動画の両方に対応する独立した動画モデルです。現在の公開価格根拠で確認できるのは6つの生成ティアだけなので、Rivyaでは検証済みセットとして `720p_5 = 12`、`720p_10 = 30`、`1080p_5 = 30` に絞っています。

選ぶ理由

テキストと画像の両方のティアに明確な公開価格根拠がある

最適
5秒のローンチティーザーとソーシャル広告
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1回の生成あたり12-30クレジット
テキスト生成と画像生成が、整合した1つのモデル項目を共有テキストモードでは `aspectRatio` を維持し、画像モードではソース画像の比率に従う

Runway

Runway Aleph

動画

既存クリップを新しい視覚結果へ作り替えるためのソース動画変換プロジェクトです。動きは入力映像から、クリエイティブ方向はプロンプトから来る場合にAlephを使用します。価格は固定90クレジットです。

選ぶ理由

ソース動画1本を中心に設計されているため、動きの基盤は空白生成ではなく手元の映像から来る

最適
承認済みのソースクリップを別のアートディレクションやムードへ作り替える作業
入力
テキスト / 参照 / 動画 / 画像
出力
動画
クレジット
1回の生成あたり90クレジット
プロンプト主導の変換に、スタイルや被写体誘導用の任意の参照画像1枚を追加できる標準的なRunwayの5秒または10秒のテキスト/画像生成とは分けて扱える

Luma

Luma Modify Video

動画

既存の 1 本のクリップを新しい視覚方向へ押し出すための、独立したソース動画リライトプロジェクトです。プロンプトで変えるべき対象が書き出し品質の改善ではなく、映像そのものの変換である場合に使用します。

選ぶ理由

単純な強化ではなく、ソース動画のリライトに特化

最適
承認済みのソースクリップを別のムード、スタイル、アートディレクションへ変える作業
入力
参照 / 動画
出力
動画
クレジット
1 回の生成あたり 30 クレジット
短いクリップ、1 つのリライト目標、英語起点の 1 つのプロンプトに最適見た目、雰囲気、アートディレクションを変える場合はアップスケーラーより適している

xAI

Grok Imagine Video

動画

Fun / Normal / Spicy のクリエイティブモードと 5 種類のアスペクト比に対応した xAI の動画モデルです。遊び心のある表現から映画的な表現、よりエッジの効いた表現まで、用途に合わせた独自のスタイルプリセットを使えます。

選ぶ理由

独自の Fun / Normal / Spicy クリエイティブモード

最適
スタイルを効かせたティザークリップやソーシャル向けモーション
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1 回の生成あたり 10 クレジットから
秒単位の課金に対応した 480p と 720p の出力ティア6 秒から 30 秒までのクリップ

OpenAI

Sora 2 Pro

動画

Sora 2のプレミアムティアです。Standard/Highの品質モード、10秒/15秒クリップ、ウォーターマーク削除に対応し、プロ向け動画制作で細部、光、動きの再現性を高めます。

選ぶ理由

制作用途向けのStandardとHighの品質段階

最適
プレミアムな商品フィルムとローンチ動画
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1回の生成あたり75クレジットから
細部、ライティング、動きの再現性を強化10秒または15秒のクリップと10K文字プロンプトに対応

OpenAI

Sora 2

動画

OpenAIの動画モデルです。テキスト動画生成と画像動画生成、リアルな世界シミュレーション、同期音声、10秒/15秒クリップ、横向き/縦向き出力、任意のウォーターマーク削除に対応しています。

選ぶ理由

物理的に正確な世界シミュレーション

最適
短い映画的な商品ティザーやローンチティザー
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1回の生成あたり6クレジットから
10秒または15秒のクリップ尺と長いプロンプト(10K文字)に対応横向きと縦向きの出力オプション

OpenAI

Sora Watermark Remover

動画

Rivyaで、完成済みの公開Sora共有リンク向けに使う、Soraのウォーターマーク削除後処理モデルです。動画そのものがすでに完成しており、残りの作業がウォーターマーク削除とS3またはOSSの配信先選択だけの場合に使います。

選ぶ理由

汎用のアップロード動画ではなく、公開`sora.chatgpt.com`共有リンク専用

最適
納品前に公開Sora共有リンクからウォーターマークを削除する作業
入力
動画
出力
動画
クレジット
1回の実行あたり3クレジット
ウォーターマーク削除をSora 2やSora 2 Proの生成とは分けて扱えるRivya上で必要な判断は、公開動画URLと出力ストレージ先の2つだけ

Topaz

Topaz Video Upscaler

動画

Topaz Video Upscalerは、書き出し時にもう少し鮮明さが必要な承認済みクリップ向けの、Rivyaの納品品質動画アップスケーラーです。ショット、動き、タイミングがすでに正しく、残りの問題が解像度や最終ファイルの鮮明さであるときに使います。

選ぶ理由

鮮明さや納品解像度だけが足りない、すでに承認済みのクリップに最適

最適
クライアント納品、プレゼン、公開前に承認済みクリップを鮮明化する作業
入力
参照 / 動画
出力
動画
クレジット
1回の実行あたり12クレジット
単一動画、プロンプトなしのプロジェクトなので、編集後の仕上げ工程として使いやすい1x、2x、4xのシンプルな段階と、現行の固定12クレジットティア

Google

Veo3.1 Quality

動画

Google Veo 3.1の品質優先バリアントです。プレミアムなテキスト動画生成と画像主導生成に向いています。より高精細な映像、強い動きのリアリズム、標準で含まれる背景音声により、Rivyaの上位Veoオプションになっています。

選ぶ理由

Rivya上の上位Veo出力パス

最適
ヒーローローンチフィルムとプレミアムなブランドスポット
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1回の生成あたり150クレジットから
プレミアムなブランドスポットやヒーローシーンにより適している背景音声を標準で含む

Google

Veo3.1 Fast

動画

Google Veo 3.1の高速版です。テキスト動画生成、画像動画生成、参考画像からの動画生成という3つのモードに対応しています。最大3枚の参考画像、ネイティブ音声、モードを意識したアスペクト比コントロールにより、素早い映画的クリップに役立ちます。

選ぶ理由

3つのモード:テキスト / 画像 / 参考画像から動画生成

最適
ネイティブ音声付きの素早い広告コンセプト
入力
テキスト / 参照 / 画像
出力
動画
クレジット
1回の生成あたり20クレジットから
ガイド付き生成向けに最大3枚の参考画像に対応動画と一緒にネイティブ音声を生成

Google

Veo3.1 Lite

動画

Google Veo 3.1の最も低コストなバリアントです。Rivyaでは現在、最小の安定サブセットだけを公開しており、テキスト動画生成と画像動画生成を固定`10`クレジット / 生成で使えます。

選ぶ理由

Rivya上でテキスト動画生成と画像動画生成のどちらも固定10クレジット

最適
上位ティアに費用をかける前の低コストなVeo実験
入力
テキスト / 参照 / 画像
出力
動画
クレジット
10クレジット / 生成
現在の最低コストティアでVeo 3.1の基本生成フローを維持プロンプトのみの生成と画像主導の生成の両方に対応

Suno

Suno Music

音声

Suno Musicは、短い依頼文をボーカルあり、またはインストゥルメンタルの最初の楽曲ドラフトに変えるための、Rivyaのテキスト音楽生成モデルです。固定`12`クレジットの入口を保ち、トラック成功後の次のステップとして`Extend Music`を公開しています。

選ぶ理由

1回の生成あたり12クレジットの固定価格を明示

最適
長い制作フローに入る前に楽曲の方向を試す作業
入力
テキスト
出力
音声
クレジット
12クレジット / 生成
初回リリースではSunoファミリー全体を一度に公開せず、範囲を絞る成功したトラックはExtend Musicアクションで継続可能

Suno

Suno Sounds

音声

Suno Soundsは、アンビエンスループ、背景音、短いサウンドスケッチを作るための、Rivyaの軽量なテキスト音声生成モデルです。公開されている固定価格`3`クレジット / 生成を保ち、成功した結果は`Vocal Separation`へ続けられます。

選ぶ理由

1回の生成あたり3クレジットの固定価格を明示

最適
アンビエンスベッド、ループ、環境音アイデアの生成
入力
テキスト
出力
音声
クレジット
3クレジット / 生成
初回リリースでは、loop、BPM、Keyだけを最もリスクの低いパラメータ範囲として公開標準の音声URLを使う現行のSuno音声結果チェーンを維持

Suno

Suno Lyrics

音声

Suno Lyricsは、1つのテーマやムードを歌詞に変えるための、Rivyaの歌詞生成モデルです。リクエストごとに固定`1`クレジットで使えます。

選ぶ理由

固定1クレジットの歌詞生成

最適
フル楽曲を生成する前に歌詞を下書きする作業
入力
テキスト
出力
音声
クレジット
1クレジット / 生成
最もリスクの低いプロンプトのみのパラメータ範囲だけを公開メディアURLなしでも成功できる形で、非同期タスクフローを維持

ElevenLabs

ElevenLabs Dialogue V3

オーディオ

Rivya で使える ElevenLabs のマルチスピーカー対話モデルです。役割分担された音声生成向けに作られており、個別の声の割り当て、安定性の調整、ポッドキャスト、インタビュー、キャラクターシーン向けの対話に適したテンポ調整を備えています。

選ぶ理由

マルチスピーカー対話生成

最適
2 人ホストのポッドキャスト冒頭や討論セグメント
入力
テキスト
出力
音声
クレジット
長さまたは再生時間に応じてクレジットを消費
キャラクターごとの個別音声割り当て安定性を調整して一貫した読み上げにできる

ElevenLabs

ElevenLabs Turbo 2.5

オーディオ

Rivya で使える ElevenLabs の高速テキスト読み上げモデルです。低遅延の音声生成と、安定性、類似度、スタイル、速度の調整に対応しており、すばやいボイスオーバー下書きやインタラクティブな TTS プロジェクト向けに作られています。

選ぶ理由

最速の ElevenLabs TTS - 低遅延に最適化

最適
製品デモやアプリ操作紹介のボイスオーバー
入力
テキスト
出力
音声
クレジット
長さまたは再生時間に応じてクレジットを消費
安定性、類似度、スタイル、速度を調整可能複数の音声プリセットと文脈対応生成

ElevenLabs

ElevenLabs Multilingual V2

オーディオ

Rivya で使える ElevenLabs の多言語テキスト読み上げモデルで、自動検出により約 30 言語をサポートします。ローカライズ、言語をまたぐ配信、より自然な多言語ボイスオーバーに向いた強力な選択肢です。

選ぶ理由

約 30 言語を自動検出して生成

最適
ローカライズされた製品デモやオンボーディング動画
入力
テキスト
出力
音声
クレジット
長さまたは再生時間に応じてクレジットを消費
人間らしい抑揚とトーンのニュアンス安定性、類似度、スタイル、速度の同じ音声コントロール

ElevenLabs

ElevenLabs Sound Effect V2

オーディオ

Rivya で使える ElevenLabs のテキストから音を生成するモデルです。短い効果音、トランジション、アンビエンスループ向けで、0.5〜22 秒の音声クリップを生成できます。プロンプトの影響度、ループモード、19 種類の出力形式を調整して、編集、プロダクト、ゲームの各プロジェクトに使えます。

選ぶ理由

0.5〜22 秒の音声長を調整可能

最適
UI のクリック音、通知音、アプリのフィードバック音
入力
テキスト
出力
音声
クレジット
長さまたは再生時間に応じてクレジットを消費
プロンプトの影響度を調整可能自然につながるループ用モード

ElevenLabs

ElevenLabs Audio Isolation

オーディオ

Rivya で使える ElevenLabs の音声クリーンアップとボイス分離モデルです。1 本の録音をアップロードして、音声を分離し、背景ノイズを取り除き、編集や公開の前に話し声を整えられます。

選ぶ理由

アップロード型の音声分離 - プロンプト不要

最適
編集前のインタビューやポッドキャスト録音の整音
入力
参照 / 音声
出力
音声
クレジット
長さまたは再生時間に応じてクレジットを消費
音声分離と背景ノイズ除去音声の長さに応じた従量課金

試す価値のある候補が見つかりましたか?

ここでモデルを候補に絞り込み、アプリ、ウォレット、プロジェクト履歴を切り替えずに Rivya 内で試せます。
サインアップで 6 クレジット
すばやく登録