GB200硬件体系结构——组件供应链和M
BOCI·2024-07-17 23:41

根据电话会议纪要,可以总结以下关键要点: 行业或公司: - 英伟达的GB200服务器系统 核心观点和论据: 1. GB200通过优越的硬件架构在性能上带来了显著进步,但部署的复杂性急剧上升。[1] 2. GB200有4种不同的形式因子:GB200 NVL72、GB200 NVL36x2、GB200 NVL36x2(Ariel)和B200 NVL72/NVL36x2(米兰达)。[3][6][7][8] 3. GB200每个计算托盘的最大TDP为6.3 kW,NVL72总功耗为123.6 kW,NVL36x2总功耗为132 kW。[9][10] 4. GB200采用比安卡板,每个板包含2个布莱克威尔GPU和1个Grace CPU,CPU和GPU比例为1:2。[11][12] 5. GB200的后端网络主要使用Quantum和Spectrum系列交换机,前端网络大多采用200G的ConnectX-7/8网卡。[34][35][38][39][40][41] 6. GB200采用直接液体冷却(DLC)技术,包括液体对空气(L2A)和液体对液体(L2L)两种形式因子,需要重新设计数据中心基础设施。[59][60][61][70][72][73][74][75][76][77] 7. GB200的电源网络采用48V直流架构,每个机架有2-4个电源架提供66-132 kW的电源。[84][87][88] 8. GB200相比HGX系统,BMC内容有较大增加,每个GPU平均有1.5个BMC。[91][92][93][94][95] 9. GB200的机械部件如底盘和轨道套件相比HGX有所降级,成本有所下降。[100][101] 10. GB200的OEM/ODM供应链有较大变化,部署的复杂性要求更多的定制化。[102] 其他重要内容: - 英伟达正在将供应链从法布林内和因诺莱特大幅扩展到埃普托林克,在光学和DSP方面有较大变化。[50] - 英伟达内部开发了1.6T的DSP,但产能有限,主要由博通和因诺莱特提供。[51] - 英伟达正在大幅扩充PCB材料供应商的产能,以满足GB200的需求。[56] - 液体冷却部件的供应商竞争格局较为复杂,终端客户和OEM/ODM在选择供应商时有较大影响力。[78][79][80][81][82][83] [序号]