AWS推出基于英伟达H100 GPU的Amazon EC2 P5实例,助力超级计算级AI性能

AWS用户现在可以体验到AI训练和推理领域的领先性能,这得益于云计算巨头正式推出的新Amazon EC2 P5实例,该实例由英伟达H100 Tensor Core GPU提供支持。通过这项服务,用户可以轻松地通过浏览器一键扩展生成式AI、高性能计算(HPC)以及其他应用程序。

d2b5ca33bd150007

英伟达H100 GPU采用了第四代Tensor Cores、新的Transformer引擎用于加速语言模型(LLMs),以及最新的NVLink技术,后者使得GPU之间的通信速度高达900GB/秒,为超级计算级别的性能提供了支持。

Amazon EC2 P5实例非常适合训练和推理日益复杂的LLMs和计算机视觉模型。这些神经网络驱动着最具挑战性和计算密集型的生成式AI应用,如问题回答、代码生成、视频和图像生成以及语音识别等。

P5实例可以部署在EC2 UltraClusters这样的超大规模集群中,这些集群由高性能计算、网络和云存储组成。每个EC2 UltraCluster都相当于一台强大的超级计算机,使用户能够在多个系统上运行最复杂的AI训练和分布式HPC工作负载。

借助P5实例,机器学习应用程序可以利用NVIDIA Collective Communications Library在多达20,000个H100 GPU上运行。

英伟达AI Enterprise可以帮助用户充分发挥P5实例的潜力,提供了一个全套软件,包括100多个框架、预训练模型、AI工作流程以及用于调整AI基础设施的工具。

英伟达AI Enterprise的目标是简化AI应用程序的开发和部署,解决构建和维护高性能、安全、云原生AI软件平台的复杂性。这个软件可以在AWS Marketplace上获取,提供持续的安全监控、定期修补常见漏洞、API稳定性、企业支持,以及与英伟达AI专家互动的机会。

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容