研究者視点で見た「GPT-4o」の評価と謎、GPT-5に向けた「たった1秒」の伏線とは

AI要約

新型AIモデル「GPT-4o」が発表され、研究者たちから多くの疑問が投げかけられています。性能の高速化や一部の低下があり、詳細な検証が求められています。

GPT-4oは汎用人工知能(AGI)に近づき、次世代の「GPT-5」への期待が高まっています。

公式情報が少ない中、GPT-4oに関する詳細性能を推測するために実際の利用者の知見も重要となっています。

研究者視点で見た「GPT-4o」の評価と謎、GPT-5に向けた「たった1秒」の伏線とは

 新型AIモデル「GPT-4o」が発表されたものの、実は多くの謎が残されており、研究者たちからもさまざまな疑問が投げかけられています。特に、旧GPT-4に比べて驚異的に高速化された出力スピードは、単なるハードウェアの改善だけでは説明できないレベルのものです。一方、性能の一部が低下しているという報告もあり、今後の詳細な検証が求められそうです。GPT-4oは汎用人工知能(AGI)に近づく一歩とされており、次世代の「GPT-5」への期待も高まっています。この記事では、『生成AIで世界はこう変わる』の著者で、東大 松尾研究室の今井翔太氏が、研究者の視点でGPT-4oの性能と次世代のGPT-5への可能性について解説します。

前回記事・前々回記事はこちら

GPT-4oをわかりやすく解説、専門家が「時代の転換点」と評価するヤバすぎる能力

(https://www.sbbit.jp/article/cont1/140613)

GPT-4oの動画・画像、音声の能力は? これから使える機能、今わかっていることまとめ

(https://www.sbbit.jp/article/cont1/140613)

 ここからは少し研究的な視点での解説になります。用語についても少し研究的な色が強くなり、使われている用語の傾向が少し変わること(言語生成AI→大規模言語モデルなど)をご了承ください。

 手前味噌で恐縮ですが、以下のような生成AIに関する研究的な内容も理解したいという方のために拙著『生成AIで世界はこう変わる』をおすすめさせていただきます。

 ここまでGPT-4oの圧倒的な性能を解説してきたところですが、GPT-4oのまとまった研究報告や論文といったものは公式からも他の研究機関からも(少なくともこの記事の執筆時点では)まだ少ない状況です。

 すべての情報が明らかにされないまでも一応Technical Reportが存在していたGPT-4と比べてもGPT-4oは謎が多いモデルです。

 なお、OpenAI CEOサム・アルトマン氏が後日出演した対談動画によると、アルトマン氏本人もGPT-4oに触れている期間は1週間程度しかないということらしく、グーグルの発表に合わせて急遽リリースしたというのも背景にありそうです。

 ただ、発表から1週間程度が経過し、私自身や他のユーザーが実際に利用した知見も貯まってきていますので、そこからある程度推測可能なGPT-4oの詳しい性能を書いてみようと思います。