「生成AIは“賢さ”より”即応性”の時代へ突入」Google発表で来場者がざわついた「AIとの対話」

AI要約

生成AIを軸とした、ビッグテックによる「AI開発競争」が第2幕を迎えた。

GoogleとOpenAIが画像・音声対応と即応性を重視し、AIの活用を一般化させる動きを見せている。

Googleの「Project Astra」は自然な対話を実現し、生成AIの進化がスマートフォンなどへの影響を考えさせている。

「生成AIは“賢さ”より”即応性”の時代へ突入」Google発表で来場者がざわついた「AIとの対話」

 生成AIを軸とした、ビッグテックによる「AI開発競争」が第2幕を迎えた。

 5月14日(アメリカ太平洋時間)にGoogleは、例年通り年次開発者会議「Google I/O 2024」を開催。今年は例年以上に「AI」にフォーカスした基調講演を行った。

 一方でそれに先回りするように、5月13日にはOpenAIが同社の生成AI「GPT-4」の改良版にあたる「GPT-4o」を発表し、話題をさらった。

 両社の発表には明確な共通点がある。

 それは「画像・音声対応」と「即応性」だ。

 こうした要素を両社が重視するのは、AIの活用が一般化するために必須のことだからである。

 それはどういうことなのか、そして、この変化はスマートフォンなどにどのような変化をもたらすかを考えてみよう。

■自然な対話を実現する「Project Astra」

 Google I/Oでの発表の中でも、来場者が特にざわめいたのは「Project Astra」だった。

 これがどのような技術であるかは、基調講演で公開されたデモのビデオを見るのが近道だ。

 スマートフォンのカメラで見たものがなにかを識別し、声での質問に、自然な音声で答える。ただ回答するだけではない。単に目の前の課題に答えるだけでなく、それまでに交わした会話の中で出てきたものを理解し、記憶し、その情報を使って質問に回答する。

 Google I/Oの会場には限定的なものながら、デモを体験できる機会も用意されていた。筆者も体験してみたが、非常に印象的なものだった。

 画面に線で絵を描き、「これはランドマークの1つ」とヒントを与えると、Astraは「ゴールデンゲートブリッジですね」と答える。

 最初に黄色いバスのおもちゃを見せて「これはジョージという名前」と伝え、その後にいくつか別のおもちゃを見せつつ名前をつけたあと、「ジョージの色は?」と聞くと「黄色ですね」と答えてくる。

 回答はスムーズで、人間との対話にかなり近い。知識を蓄えた生成AIや検索エンジンとも異なり、より人間のように多様な情報を使い、人間のような対話を実現するもの……という印象だ。

■チャットボットから「マルチモーダル」へ

 現在の生成AIは、命令を文章として与えて回答が文章で返ってくる「チャットボット型」のサービスが主流だ。しかし、それだけが生成AIの使い方というわけではない。