2024年5月14日、Googleは革新的な生成AIモデル「Veo」と「Imagen 3」を発表しました。これらのモデルは、それぞれVideoFXとImageFXで利用でき、ウェイトリストに登録すると使用可能になります。この発表は、生成AI技術の進化とその応用範囲の広がりを示しています。
Veo: 次世代の動画生成AI
**Veo**は、テキストや画像のプロンプトから1分以上の1080p動画を生成できる画期的な動画生成AIです。このモデルは、タイムラプスや空撮などの映画制作で用いられる表現を理解しており、シーン全体で被写体やスタイルの一貫性を維持した動画を生成することができます 。
例えば、ユーザーが「夕暮れの海辺で波が打ち寄せるシーン」をプロンプトとして入力すると、Veoはそのシーンをリアルかつ美しい動画として生成します。この技術は、映画制作、広告、教育コンテンツなど、さまざまな分野での応用が期待されます。
Imagen 3: 高度な画像生成AI
一方、**Imagen 3**は、Googleの最新のテキストから画像への拡散技術を利用した画像生成AIです。高品質な画像生成能力を持ち、テキストの説明に基づいて写実的な画像を生成することができます。また、多言語対応や現実的な人間の特徴のレンダリングにおいても改善が施されています 。
Imagen 3は、ユーザーが「青空の下の花畑」といったプロンプトを入力することで、その情景を美しく描写する画像を生成します。このツールは、クリエイティブな制作活動を支援するために設計されており、Google CloudのVertex AIに統合されています。
Googleの新しい生成AIモデル「Veo」と「Imagen 3」は、生成AI技術の最前線を行くものであり、さまざまな分野での応用が期待されています。これらの技術は、映画制作から広告、教育、そして個人のクリエイティブなプロジェクトに至るまで、多岐にわたる利用が可能です。最新情報や詳細については、Googleの公式ブログポストで確認できます。
– 詳細は[Google Labs: How to try ImageFX and MusicFX generative AI tools](https://blog.google/technology/ai/google-labs-imagefx-textfx-generative-ai/)および[Google: Gemini API, Imagen 2, Duet AI and more updates](https://blog.google/technology/ai/google-gemini-pro-imagen-duet-ai-update/)をご覧ください。
Google AI Models Performance
特徴 | Veo | Imagen 3 |
---|---|---|
プラットフォーム | VideoFX | ImageFX |
使用可能解像度 | 1080p | 高品質画像 |
プロンプト | テキスト、画像 | テキスト |
動画生成時間 | 1分以上 | – |
特殊効果 | タイムラプス、空撮 | 写実的な人間の特徴、多言語対応 |
一貫性 | シーン全体で被写体やスタイルの一貫性を維持 | – |
インターフェース | VideoFX経由で利用可能 | ImageFX経由で利用可能 |
トレーニングデータ | 映画製作の表現を理解 | Googleの最新テキストから画像への拡散技術 |
利用条件 | ウェイトリスト登録後に使用可能 | ウェイトリスト登録後に使用可能 |
統合プラットフォーム | – | Google CloudのVertex AI |