グーグル、画像生成AI「Imagen 3」の性能評価結果を公開

AI要約

Google DeepMindがAIチャットボットの競争を通じ、Imagen 3が最も優れた画像生成AIであることを発表した。

Imagen 3は人間による評価や自動評価の両面で優れた性能を示し、他の主要なモデルを引き離して勝利した。

Google LabsのImageFXを通じてImagen 3を利用することができ、プロンプト入力インターフェースには面白い機能が備わっている。

グーグル、画像生成AI「Imagen 3」の性能評価結果を公開

 市場には多数のAIチャットボットが存在し、最良のものを選ぶのは困難になりがちだ。Google DeepMindはこうした議論に決着をつけるべく主だったチャットボットを互いに競わせ、ユーザーが最も感銘を受けた画像生成AIは「Imagen 3」だったと発表した。

 Google DeepMindが米国時間8月14日に公開したレポートでは、Imagen 3の性能を前世代モデルの「Imagen 2」のほか、主要な他社モデル「DALL-E 3」「Midjourney v6」「Stable Diffusion 3 Large」「Stable Diffusion XL 1.0」に対し、人間による評価と自動評価の両面でどのように比べたかを詳述している。

 人間による評価では、テキストから画像を生成するモデルの5つの品質側面(満足度、プロンプトと画像の一致度、視覚的な魅力、詳細なプロンプトの反映度、数値的推論)についてテストした。

 全体的な満足度のカテゴリーは、入力したプロンプトによって得た画像について、ユーザーがどの程度満足できたかを測定したもので、次の画像で示すようにImagen 3が競合を大きく引き離して勝利する結果となった。

 Imagen 3は人間による別の評価カテゴリーに加え、自動評価項目すなわちプロンプトと画像の一致度(こちらでも)や画像品質においても競争力のある性能を発揮した。

 Imagen 3は「Google Labs」のツール「ImageFX」を通じて利用できる。Google Labsはアイデアや製品をテストするためのGoogleのプラットフォームだ。ほかのGoogle Labsツールと同様に、ImageFXも簡単に無料で利用できる。

 必要なのは、Google LabsにアクセスしてImageFXを選択するか、ImageFXのページに直接アクセスするだけだ。その後、自分のGoogleアカウントにサインインすれば、同ツールを操作することが可能になる。ほかの画像生成ツールと同じく、描いてほしい内容を会話形式で入力する。

 ImageFXのプロンプト入力インターフェースには、「表現チップ」という面白い機能がある。プロンプトを入力すると一部の単語について選択肢が表示されるのだが、これはプロンプトの内容を微調整する新しくて楽しい方法だ。Googleによれば「自分の創作物やアイデアに隣接する次元」を試せるという。

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。