# 評価ベンチマーク 2024.08.25 ChatGPTでも不合格? 会話型AIの「本当の実力」を測る新ベンチマークが登場 ChatGPT、Claude、Gemini、Mistralなど、会話型AIが次々と登場している。ほんの1年前まではChatGPTほぼ一択であったが、いまは多すぎてどれを選べばいいかわからない人も多いはずだ。そんな中、AIスタートアップのSierraが、会話型AIの精度を“客観的に