Meta「Llama 3.1」発表、無料＆商用可能なオープンソースLLMで「GPT-4o」を凌駕

AI要約

Metaはオープンソースの大規模言語モデル「Llama 3.1」を発表しました。新たな405Bモデルを導入し、既存の8Bモデルと70Bモデルもアップグレードされました。

「Llama 3.1」はコンテキストウィンドウが128Kに拡張され、多言語サポートも強化されました。他社モデルとの競合力も高く、高度なユースケースをサポートします。

トレーニングデータは15兆トークンで行われ、各種クラウドサービスで利用可能。コスト削減も魅力的な特徴です。

Meta「Llama 3.1」発表、無料＆商用可能なオープンソースLLMで「GPT-4o」を凌駕

　米Metaは7月23日（現地時間）、オープンソースの大規模言語モデル「Llama 3.1」を発表した。ラインナップに405Bモデルを導入し、最新リリースに合わせて「Llama 3」の8Bモデルと70Bモデルにもアップグレードが実施される。各モデルウェイトは公式サイトおよび「Hugging Face」より無料でダウンロード可能。

　「Llama 3.1」は、Metaが研究を進めている商用利用可能な大規模言語モデル（LLM）「Llama」の最新版。今回の新モデルでは、コンテキストウィンドウが128Kに、多言語サポートも拡張されている。

　同社によると、150を超える複数のベンチマークにおいて「Llama 3.1」は、米OpenAIの「GPT-4o」や米Anthropicの「Claude 3.5 Sonnet」といった他社モデル（クローズドモデル）と競合できることが示されたとしている。

　「Llama 3.1」は、長文テキストの要約、多言語会話エージェント、コーディングアシスタントといった高度なユースケースをサポート。ライセンスを変更し、開発者が「Llama」モデル（405Bを含む）の出力を使用して他モデルを改善できるようにした。また、「Llama Guard 3」（入力出力調整）と「Prompt Guard」（悪意のあるプロンプト攻撃から保護）といったセキュリティツールでリファレンスシステムを強化し、モデル層を超えて責任のあるAI開発を支援する。

　トレーニングデータは15兆を超えるトークン規模で行なわれ、使用された米NVIDIAのGPU「H100」は16,000個以上にもなるという。

　最新モデルは、AWS、Databricks、Dell、NVIDIA NIM、Groq、IBM WatsonX、Google Cloud、Microsoft Azure、Scale AI、Snowflakeといった主要なクラウドサービスで利用できる。発表初日よりサービスが提供開始されており、Metaによると、「GPT-4o」などのクローズドモデルを使用する場合よりも、コストを50％カットできるとしている。

　なお、「Llama 3.1」は“オープンソース”モデルと謳われているが、「llama.meta.com」および「Hugging Face」からダウンロードする際には、氏名や生年月日といった個人情報の入力、コミュニティライセンスと利用規約の同意が必要となっている。

人工知能テクノロジークラウドコンピューティング Meta Llama 3.1 大規模言語モデルオープンソースクラウドサービス