Googleが新しい生成AIモデル「Veo」と「Imagen 3」を発表

AI 人工知能ビジネストレンド

Googleが新しい生成AIモデル「Veo」と「Imagen 3」を発表

2024.05.15

2024年5月14日、Googleは革新的な生成AIモデル「Veo」と「Imagen 3」を発表しました。これらのモデルは、それぞれVideoFXとImageFXで利用でき、ウェイトリストに登録すると使用可能になります。この発表は、生成AI技術の進化とその応用範囲の広がりを示しています。

Veo: 次世代の動画生成AI

**Veo**は、テキストや画像のプロンプトから1分以上の1080p動画を生成できる画期的な動画生成AIです。このモデルは、タイムラプスや空撮などの映画制作で用いられる表現を理解しており、シーン全体で被写体やスタイルの一貫性を維持した動画を生成することができます。

例えば、ユーザーが「夕暮れの海辺で波が打ち寄せるシーン」をプロンプトとして入力すると、Veoはそのシーンをリアルかつ美しい動画として生成します。この技術は、映画制作、広告、教育コンテンツなど、さまざまな分野での応用が期待されます。

Imagen 3: 高度な画像生成AI

一方、**Imagen 3**は、Googleの最新のテキストから画像への拡散技術を利用した画像生成AIです。高品質な画像生成能力を持ち、テキストの説明に基づいて写実的な画像を生成することができます。また、多言語対応や現実的な人間の特徴のレンダリングにおいても改善が施されています。

Imagen 3は、ユーザーが「青空の下の花畑」といったプロンプトを入力することで、その情景を美しく描写する画像を生成します。このツールは、クリエイティブな制作活動を支援するために設計されており、Google CloudのVertex AIに統合されています。

Googleの新しい生成AIモデル「Veo」と「Imagen 3」は、生成AI技術の最前線を行くものであり、さまざまな分野での応用が期待されています。これらの技術は、映画制作から広告、教育、そして個人のクリエイティブなプロジェクトに至るまで、多岐にわたる利用が可能です。最新情報や詳細については、Googleの公式ブログポストで確認できます。

– 詳細は[Google Labs: How to try ImageFX and MusicFX generative AI tools](https://blog.google/technology/ai/google-labs-imagefx-textfx-generative-ai/)および[Google: Gemini API, Imagen 2, Duet AI and more updates](https://blog.google/technology/ai/google-gemini-pro-imagen-duet-ai-update/)をご覧ください。

Google AI Models Performance

特徴	Veo	Imagen 3
プラットフォーム	VideoFX	ImageFX
使用可能解像度	1080p	高品質画像
プロンプト	テキスト、画像	テキスト
動画生成時間	1分以上	–
特殊効果	タイムラプス、空撮	写実的な人間の特徴、多言語対応
一貫性	シーン全体で被写体やスタイルの一貫性を維持	–
インターフェース	VideoFX経由で利用可能	ImageFX経由で利用可能
トレーニングデータ	映画製作の表現を理解	Googleの最新テキストから画像への拡散技術
利用条件	ウェイトリスト登録後に使用可能	ウェイトリスト登録後に使用可能
統合プラットフォーム	–	Google CloudのVertex AI

投稿者: sabre

OpenAIが「GPT-4o」を発表　最新モデルがまるで人間のようと話題に

2018-2024年 TikTokの年間アクティブユーザー数推移

SABRE