微软Azure成为首个NVIDIA Blackwell"GB200"AI服务器的云平台

站长云网 2024-10-10 5iter.com 站长云网

微软宣布,其Azure云平台将成为全球首个运行英伟达全新BlackwellGB200AI服务器的平台。微软今天展示了为Azure人工智能云计算平台打造的英伟达BlackwellGB200服务器。微软Azure的官方账号发布消息称,他们是首个拥有GB200人工智能服务器的云系统,可用于扩展高级人工智能模型。

MicrosoftAzure是第一个运行@nvidia的Blackwell系统和GB200驱动的AI服务器的云。我们利用Infiniband网络和创新的闭环液冷技术,在每一层都进行了优化,以支持世界上最先进的人工智能模型。在MSIgnite了解更多信息。pic.twitter.com/K1dKbwS2Ew

-MicrosoftAzure(@Azure)2024年10月8日

MicrosoftAzure为客户提供虚拟机、人工智能处理等服务,用于管理应用程序。这样,用户就可以扩展和升级其应用程序,而无需自己拥有硬件。通过使用最新的NVIDIABlackwellB200GPU,Azure为用户提供了前所未有的高性能。

搭载GB200的人工智能服务器将使用旗舰级数据中心B200GPU,该GPU采用GB200芯片,提供192GBHBM3e内存。该GPU是一款高性能芯片,主要用于深度学习、训练大型人工智能模型和处理大型数据集等高级和繁重的工作负载,同时比其前代产品更加高效。

通过使用B200GPU,Azure可以更快地训练人工智能模型,确保其性能在所有其他云计算平台中处于领先地位。如图所示,该公司拥有一个装有多个B200GPU的服务器机架。我们不知道这台服务器内使用了多少个B200GPU,也不知道该公司已经部署了多少个。

该服务器采用液体冷却解决方案来保持较低的温度,这看起来像是微软为了解如何在商用服务器中实施液体冷却而进行的初步测试阶段。

需要注意的是,展示的这台服务器并非GB200NVL72,英伟达为其准备了36个GraceCPU和72个B200GPU。该机架非常强大,可以构建一个强大的平台,产生高达3240TFLOPS的FP64张量核性能,并将用于台湾富士康最快的超级计算机。

我们最近报道了OpenAI在X上展示DGXB200系统,看起来还有更多的公司正在加入使用NVIDIABlackwell芯片的竞赛。

责任编辑:站长云网