一个拥有131072 个GPU的超算集群
半导体行业观察·2024-09-13 09:51

如果您希望可以时常见面,欢迎标星收藏哦~ 来源:内容 编译自tomshardware ,谢谢。 甲骨文周三推出了新型集群,可通过 Oracle 云基础设施 (OCI) 进行 AI 训练。最强大的集群将基于 Nvidia 即将推出的 Blackwell GPU,并将提供高达 2.4 ZettaFLOPS 的 AI 性能,使其比 Elon Musk 最近宣布的 AI 集群更强大。 甲骨文的新型超级计算机集群可以配置 Nvidia 的 Hopper 或 Blackwell GPU 用于 AI 和 HPC,以及不同的网络设备,包 括带有 ConnectX-7 NIC 和 ConnectX-8 SuperNIC 的超低延迟 RoCEv2 或基于 Nvidia 的 Quantum-2 InfiniBand 的网 络,以及根据性能需求选择的 HPC 存储: 配备 H100 GPU的 OCI 超级集群 最多可支持 16,384 个 GPU,提供 65 FP8/INT8 exaFLOPS 的峰值性能和 13 Pb/s(每 秒 13 拍比特)的组合网络吞吐量。 由H200 GPU驱动的 OCI 超级集群将于今年晚些时候推出,将扩 ...