GB300的冷板設計從GB200到GB300有哪些具體改進?
Answer
GB300 冷板設計:從 GB200 到 GB300 的具體改進
NVIDIA 的 GB300 伺服器平台屬於 Blackwell Ultra 系列,專為應對日益增長的 AI 運算需求而設計,尤其在推論和訓練性能方面有顯著提升。為了解決高功耗帶來的散熱問題,GB300 採用全液冷機架設計,並針對冷板設計進行了多項改進。
冷板設計的主要改進
GB300 的冷板設計相較於 GB200 有以下具體改進:
- 冷板結構:GB300 將 GB200 的單片式冷板改為三片式,分別覆蓋 CPU 和 GPU。這種設計能夠更精確地針對各個組件進行散熱,提高散熱效率。
- 快速連接器 (UQD):GB300 將快接頭數量從每托盤 4 組增加到 12 組,進一步提升散熱效率,確保在高負載下系統穩定運行。
- 水冷板配置:NVIDIA GB300 每層 Compute Tray 配置 9~12 個水冷板,這種設計有助於更有效地將熱量從伺服器內部導出。
其他相關設計特色
除了冷板設計的改進外,GB300 還具有其他一些重要的設計特色:
- 強大的運算性能:搭載 B300 GPU,功耗高達 1400W,單卡 FP4 性能提升 1.5 倍。
- 更大容量的記憶體:每個 B300 GPU 配置 288GB 的 HBM3e 記憶體,採用 12 層堆疊設計,提供更大的記憶體容量以支援複雜的 AI 運算。
- 高速網路連接:配備 ConnectX-8 網路卡,頻寬翻倍,並支援 48 條 PCIe 通道,確保高速的數據傳輸。
- 模組化與客製化設計:採用插槽設計,計算板使用 LPCAMM,提高系統靈活性,方便客戶進行客製化配置。