Blackwell GPUサーバー『GB200 NVL72』にオーバーヒート問題か。NVIDIAの回答は

GPU

NVIDIA GB200 NVL72

NVIDIA Blackwell GPUを搭載した次世代AIサーバー『GB200 NVL72』に、オーバーヒートの問題があると報じられています。

本件について報じた海外メディアのThe Informationによると、最大72基のBlackwell GPUを搭載できるよう設計されたサーバーラック(つまり、GB200 NVL72サーバーラック)に、Blackwell GPUを実際に搭載して稼動させるとオーバーヒートが発生するとのこと。この問題により、投入の遅延が懸念されています。

また、この問題に取り組んできたNVIDIA従業員や、この問題を知る顧客、サプライヤーによると、オーバーヒート問題を解決するために、NVIDIAは数回にわたってサプライヤーに対してサーバーラックの設計変更を要請したとのこと。

本件について、海外メディアのReutersがNVIDIAに問い合わせたところ、以下の回答を得ました。

弊社(NVIDIA)のエンジニアリングチームは、不可欠な工程の一部として主要なクラウドサービスプロバイダーと協力しています。技術的な調整の繰り返しがあるのは普通のことであり、予想されたものです。

― NVIDIA広報担当者

NVIDIAによると、このような調整の繰り返しは普通のことで予想されたものとのこと。投入時期の遅延等に関する言及はありません。

Blackwell

Posted by にっち