Google推出基于H100 A3 GPU超级计算机

最新推荐文章于 2024-09-11 14:42:31 发布

Steve Y

最新推荐文章于 2024-09-11 14:42:31 发布

阅读量63

点赞数

文章标签： gpu 人工智能大数据

本文链接：https://blog.csdn.net/weixin_49849743/article/details/130662510

版权

谷歌在I/O大会上展示了PaLM2大型语言模型，并推出了A3超级计算机，该计算机配备英特尔处理器和NvidiaH100GPU，专为训练和服务AI模型设计，提供26exaFlops的AI性能。A3强调GPU间的数据交换速度，且企业可通过填写预览兴趣表申请早期访问。

摘要由CSDN通过智能技术生成

今天下午，谷歌在谷歌I/O大会上用一个多小时的时间讲述了其在人工智能方面的众多进展。该公司讨论了其用于生成性人工智能的新的PaLM 2大型语言模型（LLM），该模型为Bard聊天机器人工具提供动力。这是一个基础支柱，用于在谷歌的产品组合中增加人工智能的功能，包括谷歌地图、谷歌照片和Gmail（以及其他）。

考虑到这一点，在云端需要一些强大的马力来为野外的模型提供动力，因为数百万（最终是数十亿）的用户发送了一些操作请求，从删除图片背景中徘徊的人到根据简短的文本提示为你撰写整封电子邮件，都是很平凡的。这就是谷歌新的A3 GPU超级计算机的重点所在。谷歌表示，新的A3超级计算机 "专门用于训练和服务最苛刻的人工智能模型，这些模型为当今的生成性人工智能和大型语言模型创新提供动力"，同时提供26 exaFlops的人工智能性能。

每台A3超级计算机都配备了第四代英特尔至强可扩展处理器，并有2TB的DDR5-4800内存支持。但操作的真正 "大脑 "来自8个Nvidia H100 "Hopper "GPU，通过利用NVLink 4.0和NVSwitch，它们可以获得3.6TBps的双向带宽。

据谷歌称，A3代表了其GPU-to-GPU数据接口的首次生产级部署，它允许在绕过主机CPU的同时以200Gbps的速度共享数据。这个接口被谷歌称为基础设施处理单元（IPU），与A2虚拟机相比，A3虚拟机（VM）的可用网络带宽提升了10倍。

英伟达公司超大规模和高性能计算副总裁Ian Buck表示："谷歌云的A3虚拟机由下一代英伟达H100 GPU驱动，将加速生成性人工智能应用的训练和服务。"在谷歌云最近推出的G2实例之后，我们很自豪地继续与谷歌云合作，用专门的AI基础设施帮助世界各地的企业转型。

如果你的企业想利用A3虚拟机，唯一的方法是填写谷歌的A3预览兴趣表，加入早期访问计划。但正如谷歌明确指出的那样，填写你的信息并不能保证在该计划中占有一席之地。

Steve Y

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Google推出基于H100 A3 GPU超级计算机

谷歌表示，新的A3超级计算机 "专门用于训练和服务最苛刻的人工智能模型，这些模型为当今的生成性人工智能和大型语言模型创新提供动力"，同时提供26 exaFlops的人工智能性能。
复制链接

扫一扫