「富岳」を活用した日本語向け大規模言語モデル「Fugaku-LLM」を公開

AI要約

スーパーコンピュータ「富岳」で学習した大規模言語モデル(LLM)の「Fugaku-LLM」が、5月10日から公開。日本製の130億パラメータのモデルで、日本語に特化した親和性が高く、日本の計算機技術を用いて開発された。

大規模言語モデルの分散並列学習手法の開発において、国内の大学や企業が連携し、富岳やABCIなどの計算リソースを活用。様々な改良を経て富岳での学習計算性能と通信性能を大幅に向上。CPUを使用し、GPU不足にも対応可能な技術を実証。

日本語に特化したTokenizerやモデルの開発が重要視され、将来的に科学研究や産業活用の可能性が広がる。AI技術の国内蓄積と、国際的な研究連携による成果の重要性が示された。

「富岳」を活用した日本語向け大規模言語モデル「Fugaku-LLM」を公開