生成AI向けクラウド「高火力」、NVIDIA GPU 2千基で2EFLOPS

AI要約

さくらインターネットは、石狩データセンターにおいて「NVIDIA H100 Tensor コア GPU」を約2,000基整備する計画を前倒しで完了し、生成AI向けクラウドサービス「高火力」が計算能力2EFLOPS(エクサフロップス)を達成。

2023年6月に発表した計画は経済産業省の認定を受け、2025年3月末までの予定を前倒しして2,016基のGPUを整備完了。さらなる計画として、2024年4月からは約8,000基のGPUを使い16.9EFLOPSを目指す計画が進行している。

2024年1月から提供を開始した「高火力」は、生成AIを中心としたクラウドサービスで、ベアメタルシリーズ「高火力 PHY」とコンテナーシリーズ「高火力 DOK」が提供されている。今後は時間単位での貸し出しや環境構築の柔軟性が高いサービスの提供を予定している。

生成AI向けクラウド「高火力」、NVIDIA GPU 2千基で2EFLOPS

さくらインターネットは、石狩データセンターにおいて「NVIDIA H100 Tensor コア GPU」を約2,000基整備する計画を完了。これにより、生成AI向けクラウドサービス「高火力」が計算能力2EFLOPS(エクサフロップス)を達成した。

2023年6月に発表した同計画は、経済安全保障推進法に基づく特定重要物資「クラウドプログラム」の供給確保計画に関する経済産業省の認定を受けたもの。2025年3月末までの完了を予定していたが、多くの引き合いがあったことから前倒しでの整備を進め、2,016基の「NVIDIA H100 Tensor コア GPU」を整備完了した。

2024年4月からは約8,000基のGPUで16.9EFLOPSを目指す計画が2027年12月までの予定で進行している。

2024年1月から提供を開始した「高火力」は、大規模言語モデルなどの生成AIを中心とした利用を想定したクラウドサービス。2024年1月から第1弾としてベアメタルシリーズ「高火力 PHY」を、2024年6月から第2弾としてコンテナーシリーズ「高火力 DOK」を提供している。今後「高火力」は時間単位で貸し出しができ、かつ環境構築の柔軟性が高いクラウドシリーズの提供など、サービスを拡大する予定。