ELYZA、「GPT-4」を上回る日本語性能のLLMを開発

AI要約

ELYZAは大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、Metaの「Llama 3」をベースとした700億パラメーターの「Llama-3-ELYZA-JP-70B」と80億パラメーターの「Llama-3-ELYZA-JP-8B」を開発し、性能を公開した。

Llama-3-ELYZA-JP-70Bは、日本語性能を向上させ、国内モデルの中で最高性能を実現している。

Llama-3-ELYZA-JP-8Bは、日本語性能が向上し、80億パラメーターのモデルで「GPT-3.5 Turbo」と同等の性能を達成した。

　ELYZAは6月26日、同社が提供する大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、Metaの「Llama 3」をベースとした700億パラメーターの「Llama-3-ELYZA-JP-70B」と80億パラメーターの「Llama-3-ELYZA-JP-8B」を開発し、性能を公開した。

　Llama-3-ELYZA-JP-70Bは、Llama-3-70Bをベースに追加の学習（日本語追加事前学習・指示学習）を実施して開発したモデル。元のLlama-3-70Bから大きく日本語性能を向上させており、日本語の性能を測定するための2つのベンチマークを用いた自動評価において、国内モデルの中では最高性能の水準を実現。「GPT-4」や「Claude 3 Sonnet」、「Gemini 1.5 Flash」と同等あるいは上回る性能を達成しているという。　

　Llama-3-ELYZA-JP-70Bは、安全なAPIサービスや共同開発プロジェクトなどを通して、さまざまな形態で順次企業向けに提供を開始。また、チャット形式のデモサイトを用意。

　Llama-3-ELYZA-JP-8Bは、MetaのLlama-3-8Bをベースに事後学習（日本語追加事前学習・指示学習）を実施して開発したモデル。Llama-3-ELYZA-JP-70B同様に元のLlama-3-8Bから大きく日本語性能が向上しており、80億パラメーターの軽量なモデルながら日本語の性能を測定するための2つのベンチマークを用いた自動評価において、「GPT-3.5 Turbo」や「Claude 3 Haiku」、「Gemini 1.0 Pro」に匹敵する性能を達成したという。

　Llama-3-ELYZA-JP-8Bについて、モデルを一般公開。本モデルはLLAMA 3 COMMUNITY LICENSEに準拠し、Acceptable Use Policyに従う限りにおいて、研究および商業目的での利用が可能。

　開発プロセスや評価のより詳細な状況についてはnote記事で解説している。

「ASCII STARTUPウィークリーレビュー」配信のご案内

ASCII STARTUPでは、「ASCII STARTUPウィークリーレビュー」と題したメールマガジンにて、国内最先端のスタートアップ情報、イベントレポート、関連するエコシステム識者などの取材成果を毎週月曜に配信しています。興味がある方は、以下の登録フォームボタンをクリックいただき、メールアドレスの設定をお願いいたします。

文● ASCII

人工知能テクノロジー言語処理 ELYZA Llama 3 日本語モデル性能