Googleが新しい生成AIモデル「Veo」と「Imagen 3」を発表

2024年5月14日、Googleは革新的な生成AIモデル「Veo」と「Imagen 3」を発表しました。これらのモデルは、それぞれVideoFXとImageFXで利用でき、ウェイトリストに登録すると使用可能になります。この発表は、生成AI技術の進化とその応用範囲の広がりを示しています。

 Veo: 次世代の動画生成AI

**Veo**は、テキストや画像のプロンプトから1分以上の1080p動画を生成できる画期的な動画生成AIです。このモデルは、タイムラプスや空撮などの映画制作で用いられる表現を理解しており、シーン全体で被写体やスタイルの一貫性を維持した動画を生成することができます 。

例えば、ユーザーが「夕暮れの海辺で波が打ち寄せるシーン」をプロンプトとして入力すると、Veoはそのシーンをリアルかつ美しい動画として生成します。この技術は、映画制作、広告、教育コンテンツなど、さまざまな分野での応用が期待されます。

 Imagen 3: 高度な画像生成AI

一方、**Imagen 3**は、Googleの最新のテキストから画像への拡散技術を利用した画像生成AIです。高品質な画像生成能力を持ち、テキストの説明に基づいて写実的な画像を生成することができます。また、多言語対応や現実的な人間の特徴のレンダリングにおいても改善が施されています 。

Imagen 3は、ユーザーが「青空の下の花畑」といったプロンプトを入力することで、その情景を美しく描写する画像を生成します。このツールは、クリエイティブな制作活動を支援するために設計されており、Google CloudのVertex AIに統合されています。

 

Googleの新しい生成AIモデル「Veo」と「Imagen 3」は、生成AI技術の最前線を行くものであり、さまざまな分野での応用が期待されています。これらの技術は、映画制作から広告、教育、そして個人のクリエイティブなプロジェクトに至るまで、多岐にわたる利用が可能です。最新情報や詳細については、Googleの公式ブログポストで確認できます。

– 詳細は[Google Labs: How to try ImageFX and MusicFX generative AI tools](https://blog.google/technology/ai/google-labs-imagefx-textfx-generative-ai/)および[Google: Gemini API, Imagen 2, Duet AI and more updates](https://blog.google/technology/ai/google-gemini-pro-imagen-duet-ai-update/)をご覧ください。

Google AI Models Performance

特徴 Veo Imagen 3
プラットフォーム VideoFX ImageFX
使用可能解像度 1080p 高品質画像
プロンプト テキスト、画像 テキスト
動画生成時間 1分以上
特殊効果 タイムラプス、空撮 写実的な人間の特徴、多言語対応
一貫性 シーン全体で被写体やスタイルの一貫性を維持
インターフェース VideoFX経由で利用可能 ImageFX経由で利用可能
トレーニングデータ 映画製作の表現を理解 Googleの最新テキストから画像への拡散技術
利用条件 ウェイトリスト登録後に使用可能 ウェイトリスト登録後に使用可能
統合プラットフォーム Google CloudのVertex AI

関連記事

  1. ChatGPTの利用率 国別ランキング

  2. トルコで不動産を購入する為の法的手続き 居住許可イカメット 市民権 永住権 費用

  3. Google Gemini VS OpenAI GPT-4 性能比較 

  4. AI人工知能を用いた言語学習が世界のトレンドに

  5. 2024年 中東・北アフリカ(MENA)地域における市場価値 銀行のランキング

  6. Aiプロンプトを専門に販売する世界のマーケットプレイス 7選

  7. 2023 世界の半導体メーカーTop10 シェアランキング

  8. ChatGPTを調教 プロンプト・エンジニアリングの原則

  9. OpenAIが動画生成Ai Soraのローンチ発表後ワールドコインWLDが史上最高値を更新

Japanese