エヌビディア新半導体、AIの進化を転換…「学習」から「推論」へ新フェーズ

 従来のBlackwell発表時(2024年3月)には、AIファクトリープラットフォーム『NVIDIA』として、例えばエヌビディアが第2世代『Transformer Engine』と呼ぶアルゴリズムが、Blackwellの低精度ながら高速な4ビット浮動小数点演算ユニットがAIの推論を高速化することにより、2倍サイズのモデルが扱えるとうたわれました。これに対しBlackwell Ultraは、当初のBlackwell世代GPUよりもマイナーチェンジで1.5倍の性能に強化されたとうたわれています。たとえば、HGX B300 NVL16は、ある条件下でのLLM推論が11倍高速化されています。

 Blackwell Ultraのソフトウェア面では、オープンソース推論フレームワーク『NVIDIA Dynamo』を活用することで、AIリーズニングサービスの拡張と応答時間の短縮、スループットの向上がはかられています。

 まとめると、Blackwell UltraではAIの推論能力を向上させるために、ハードウェアとソフトウェアの両面から強化が図られており、特にステップを踏んで深く推論する推論・思考型のAI、エージェント型AI、エージェントをセンサーや動作アームなどと連携させたフィジカルAIなどの分野での応用が期待されています」

(文=野村直之/AI開発・研究者、メタデータ株式会社社長、東京大学大学院医学系研究科研究員)