こんにちは、Technology部のジョシュです。
最近、AIによる動画コンテンツの制作に注目が集まっています。さまざまなAIツールが誕生していますが、中国の新興AI企業である「生数科技(Shengshu Technology)」がリリースした動画生成AI「Vidu AI」もそのひとつです。
「Vidu」は、OpenAIの動画生成AI「Sora」(未リリース)が採用している技術モデルを超えていると主張したことで話題を集めています。今回は「Vidu」について、具体的な使い方や魅力を解説していきます!
Vidu とは?
「Vidu」は、テキストや画像から動画を生成できる生成AIツールです。
2024年4月27日に発表された「Vidu」は、わずか30秒以内に高解像度の動画を生成できるよう設計されています。また、アニメ風とリアルの両方のスタイルで動画を作成することが可能です。
Vidu AIモデルは、「U-ViT(Universal Vision Transformer)」 と呼ばれる、独自の視覚変換モデルアーキテクチャを基盤に構築されています。
このアーキテクチャについてざっくり説明すると、画像生成のタスクにおいて高精度な生成を実現する「拡散モデル(Diffusion)」とChatGPTもベースとして採用している正確な文脈理解を可能にする「トランスフォーマーモデル(Transformer)」という2つのAIモデルを統合した技術で構築されています。
これによって、ダイナミックなカメラワーク、繊細な表情、そしてリアルな照明や影の効果を持つ高品質なビデオの生成が可能となっているのです。
Viduで動画を生成してみた
こちらがVidu AIのダッシュボード画面です。
Viduにサインアップすると、毎月80クレジットが無料でもらえます。
これらのポイントを使って動画を生成しますが、無料版だと解像度が少し低めで、1回で生成できる動画の長さは最大4秒です(有料版なら8秒まで可能)。また、1つ生成するのに4クレジットを消費します。
使い方は簡単です。まず、Viduのサイトにアクセスして、メールアドレスでサインアップしましょう。トップのナビゲーションバーにある 「Create Video」 ボタンをクリックするだけで、すぐに動画生成がスタートできます。
今回は、テキストから動画を生成する「Text-to-Video」と画像から動画を生成する「Image-to-Video」の2つを試してみます。
Text-to-Video生成
「Vidu」は、テキストから高解像度の動画を生成できます。アニメスタイルやリアリスティックなスタイルで、リアルな照明や影、表情を再現しながら、最大8秒(無料版だと4秒)のクリップを作成することができます。
では実際に生成してみます。今回は以下のプロンプトを入れてみました。
- プロンプト
- A group of superheroes enjoying sushi at a Japanese restaurant.
※和訳:「日本食レストランで寿司を楽しむスーパーヒーローたち」
このプロンプトを入れてみると……
おお、すごい。
出力された動画のクオリティに驚きました。まるで80年代のスーパーヒーローが映画から抜け出したようです。ただし、顔の一貫性を保つのに苦労しているのと、背景の漢字が日本語ではなく、文字の生成はまだまだといったところです。
この動画は3秒間のもので、解像度は688×384です。サイズが小さいので、生成には30秒もかかりませんでした。
また、設定で動画スタイルを「General」か「Animation」に切り替えることができます。ただし、このスタイル変更は「Text-to-Video」でのみ適用されます。
アニメーションスタイルでこのプロンプトを試してみましょう。
- プロンプト
- A futuristic robot enjoying sushi
※和訳:「寿司を楽しむ未来型ロボット」
生成した動画はこちらです! こちらもクオリティが高く、日本アニメっぽいトーンもしっかり出ていますね。
Image-to-Video生成
「Vidu」では画像をアップロードするとその画像をもとにした動画を生成することも可能です。今回はCanvaで生成した以下の画像を動画にしてみたいと思います。
では、Image-to-Video機能がどのように動作するか見てみましょう。画像をアップロードしたあと、動画の最初のフレームとして使用するか、キャラクターを参考として使用するかを指定します。
- プロンプト
- The samurai walking entering to restaurant
※和訳:「レストランに入る侍」
生成した動画はこちらです! カメラのズーム効果が少し奇妙に感じられる部分がありますが、素晴らしいクオリティですね。
「Vidu」料金プラン
「Vidu」には無料を含めた4つのサブスクリプションプランがあります。
無料プラン | 月に80クレジット、4秒間の動画生成、解像度のアップスケール、商用利用不可、1タスク同時実行。 |
---|---|
スタンダードプラン | 月額$9.99(通常$19.99の50%オフ)、月に320クレジット、4秒間および8秒間の動画生成、解像度のアップスケール、商用利用可、アップスケール後の透かし除去、2タスク同時実行。 |
アドバンスドプラン | 月額$29.99(通常$59.99の50%オフ)、月に880クレジット、4秒間および8秒間の動画生成、解像度のアップスケール、商用利用可、アップスケール後の透かし除去、3タスク同時実行、新機能への優先アクセス。 |
プレミアムプラン | 月額$99.99(通常$199.99の50%オフ)、月に2960クレジット、4秒間および8秒間の動画生成、解像度のアップスケール、商用利用可、アップスケール後の透かし除去、4タスク同時実行、新機能への優先アクセス。 |
また、年額サブスクリプションを選ぶことで、さらに20%の割引を受けることもできます。
まとめ
全体的に見て、「Vidu」は現在公開されている動画生成AIのなかでもかなり高品質だといえます。
ただし、動画生成AIには共通の課題があり、文字の描画や一貫性の維持もそのひとつです。「Vidu」もこの点でまだ苦戦しています。
今年に入って、動画生成がようやくテキストや画像生成に追いついてきたことは嬉しいですね。今後数ヶ月で、さらなる品質向上や低価格なサブスクリプションを提供するAI動画生成ツールが続々と登場することを期待しています。
「生成AIについて社内で理解を深めたいけど、どう進めていいかわかない」「生成AIの業務効率化について具体的な事例やアドバイスが欲しい」などご興味のある企業さまは、下記ページからお気軽にご相談ください。