重磅丨英伟达刚刚发布全球最大GPU:GTC2018黄仁勋演讲核心内容整理

文章来源:机器之心


在刚刚结束的 Keynote 演讲中,英伟达创始人兼首席执行官黄仁勋宣布了该公司在芯片、AI 平台、自动驾驶上的一系列新动作。

正如黄仁勋所说的,今天的发布会有关于:「Amazing science, amazing graphics, amazing products and amazing AI.」

核心内容:

  • 新一代服务器级 GPU:搭载英伟达 RTX 技术的 GPU Quadro GV100,以及「世界最大的 GPU」

  • NVIDIA AI 平台:TensorRT 4 等技术,多种重大改进

  • 推出 DRIVE Constellation 自动驾驶仿真系统

图注:黄仁勋 Keynote 演讲总结

搭载英伟达 RTX 技术的 GPU Quadro GV100

在今天的 GTC 大会 Keynote 中,黄仁勋首先宣布推出搭载 NVIDIA RTX 技术的 Quadro GV100 GPU,首次向数以百万计的艺术家和设计师提供实时光线追踪技术。

黄仁勋表示,结合强大的 Quadro GV100 GPU,NVIDIA RTX 能够在运行专业设计及内容创作类应用程序的同时,实现实时的计算密集型光线追踪。

Quadro GV100 具有 32GB 内存,且可借助 NVIDIA NVLink 2 互联技术,通过并联两块 Quadro GPU 扩展至 64GB,在所有适用于此类应用的平台中其性能最高。

在性能方面,GV100 基于 NVIDIA Volta GPU 架构,可提供每秒 7.4 万亿次浮点运算的双精度性能、每秒 14.8 万亿次浮点运算的单精度性能、以及每秒 118.5 万亿次浮点运算的深度学习性能。NVIDIA RTX 内置的 NVIDIA OptiX AI-denoiser 可实现实时的 AI 去噪,英伟达表示且其性能相当于采用 CPU 时的 100 倍。

NVIDIA AI 平台:多项重大改进

而后,如同往届,黄仁勋对英伟达 AI 平台做了介绍,公布了其中的一系列重要进展,包括全新 Tesla V100 32GB GPU 的 2 倍内存、革命性的 NVSwitch 结构、以及全面的软件堆栈推动性能提升、深度学习工作站 DGX-2 成为首款性能高达每秒 2 千万亿次浮点运算的深度学习系统、发布深度学习引擎 TensorRT 4 等。英伟达表示,相较于六个月前发布的上一代产品 DGX-1,其深度学习工作负载性能实现了 10 倍提升。

在大会上,黄仁勋宣布,新版的 Tesla V100 内存扩容了一倍。「5 年前 AlexNet 在 ImageNet 上展示了突破性的能力,」黄仁勋说道,「它有 8 层,数百个参数。而今天我们能够看到数百层的神经网络,内含数十亿参数,深度学习模型经过五年的发展,体量扩大了 500 倍。」

而这样的计算需求可由「世界上最大的 GPU」DGX-2 进行处理,它是由 16 块 32GB 内存的 Tesla V100 计算卡通过 NVSwitch 进行连接(显卡间的通信速度是 PCI 的 20 倍,每秒 300Gbyte)所组成的,共拥有 2000TFPLOS 的 Tensor Core 算力,售价 39.9 万美元。NVSwitch 是今天黄仁勋宣布的全新的 GPU 互联结构。

DGX-2 是首款能够提供每秒两千万亿次浮点运算能力的单点服务器,具有 300 台服务器的深度学习处理能力,占用 15 个数据中心机架空间,而体积则缩小 60 倍,能效提升 18 倍。

而后,黄仁勋宣布了英伟达在 AI 推理上的一系列动作。黄仁勋表示,基于在数据中心、汽车应 用、以及包括机器人和无人机等嵌入式设备领域中,诸如语音识别、自然语言处理、推荐系统、 以及图像识别等新功能的支持,面向深度学习推理的 GPU 加速正在获得越来越多的关注。

「我们需要超级计算机来帮助自己寻找更高效的能源存储方法,探索地球的内部,预测未来的自然灾害,以及模拟微观世界的变化。」黄仁勋说道。

英伟达宣布推出新版 TensorRT 推理软件 TensorRT 4,并将 TensorRT 集成至谷歌的 TensorFlow 框架。

此外,英伟达还宣布了面向 Kubernetes 的 GPU 加速,以促进企业在多云 GPU 集群上的推理部署。英伟达将针对开源社群强化 GPU 性能,以支持 Kubernetes 生态系统。

推出 DRIVE Constellation 仿真系统

自动驾驶一直是 GTC 大会的重要部分,今天,英伟达展示了一套用于使用照片级真实感模拟,基于云的自动驾驶汽车测试系统。

该系统被称为 NVIDIA DRIVE Constellation,是一种基于两种不同服务器的计算平台。第一台服务器运行 NVIDIA DRIVE Sim 软件,用以模拟自动驾驶汽车的传感器,如摄像头、激光雷达和雷达。第二台服务器搭载了 NVIDIA DRIVE Pegasus AI 汽车计算平台,可运行完整的自动驾驶汽车软件堆栈,并能够处理模拟数据,这些模拟数据如同来自路面行驶汽车上的传感器。

此外,英伟达还推出了机器人开发平台 ISSAC 等工具。同时宣布与 ARM 展开合作。两家公司正在合作将开源的 NVIDIA 深度学习加速器 NVDLA 架构集成到 Arm 的 Project Trillium 平台上,以实现机器学习。此次合作将使物联网芯片公司能够轻松地将 AI 集成到自己的设计中,并帮助它们将智能化且价格低廉的新产品带给全球数十亿的消费者。

小结

英伟达 GTC 大会从 2009 年开办以来,越来越受到人们的关注。而随着人工智能的火热,GPU 价值也水涨船高。而本届 GTC 相比于第一届,参会人数增加了近 10 倍,火热程度也超乎以往。但遗憾的是,今天的发布仍然围绕商用计算设备进行,不像国内外众多媒体猜测的那样会发布新一代 Geforce 显卡。或许,众多玩家还要继续等待一段时间。


NVIDIA GTC CHINA 2019 大会PPT汇总,共92份。 包括但不限于一下内容。 一、人工智能与深度学习 超越黑匣子:为深度学习注入结构 持久性 CUDA GPU 编程及其应用 从框架到平台,AWS 的深度学习实践 大规模算力平台构建和多机多卡线性扩展 滴滴端到端语音 AI 技术实践——从算法到应用 飞桨大规模分布式训练与应用 分析深度学习网络模型及自动混合精度以优化性能 基于 GPU 的 AI 计算优化方法及案例:从训练到推理 基于 GPU 的大规模音频理解和合成解决方案 基于 GPU 的大规模语言模型加速 基于 OCR 案例的 TENSORFLOW-TENSORRT(TF-TRT) 最佳实践 基于 T4 的推荐系统推理性能优化 基于 TACOTRON2 和 WAVEGLOW 的端到端语音合成加速方案 基于 TENSORFLOW 的 TRANSFORMER 模型应用与优化 计算新纪元下金融 AICC 的全双工全场景 金融行业图像识别及结构化内容抽取的 AI 应用实践 利用 TENSORRT 自由搭建高性能推理模型 美团面向生活服务场景的计算机视觉研发和应用 面向量化分析师的 GPU 加速 PYTHON 人工智能,从表型组到基因组 人工智能数据管道与应用 人工智能在医学图像临床诊断中应用研究 深度学习的对抗安全理论与方法 深度学习在心脑血管分割中的应用 深度语义匹配模型在搜狗搜索中的实践 生活服务领域知识图谱的构建及应用 使用自动混合精度加速 PADDLEPADDLE 训练 数字生命与数据自由—— GPU 加速健康大数据分析 通过 GPU 计算和深度学习加速基因分析 针对深度学习的汇编级优化-快速提高应用性能 二、智能机器、物联网和机器人 为自主机器打造的 JETSON AGX平台 ET 自动驾驶计算平台演进 三、专业视觉可视化 《光明记忆》RTX光线追踪制作经验 《剑侠情缘网络版叁》:使用实时光线追踪技术进行画质革新 超高分辨率在媒体和娱乐行业中的应用及其优化方法 光线追踪技术带来设计变革-使用QUADRO RTX GPU优化工业设计流程 基于 RTX 的云端实时渲染以及云端虚拟工作室 基于 UNITY 高清渲染管线的实时光线追踪技术介绍 基于视频信息指导的智能编舞系统 可视化技术带来产品和建筑设计的新纪元 利用 AI 技术改变视频的制作流程 利用 RTX 实现虚拟现实中的仿真渲染 人工智能运动场:提高人类的创造力 软硬件环境对建筑结构流程管理(BIM)效率的影响 商业化视频内容识别的算法设计与应用 实时光线追踪基础 使用 NVIDIA DATA SCIENCE WORKSTATION 加速数据科学实时案例分析 虚幻引擎实时光线追踪技术开启 CG 制作新时代 正在改变影视行业的 GPU 驱动的影像质量优化 四、自动驾驶汽车 大规模深度学习加速自动驾驶落地 深度学习平台在汽车智能战略中的应用 自动驾驶统一架构 五、HPC与超级计算 带有 OPENACC 和 CUDA 库的 VASP 中的新 GPU 功能 当 MARS 遇上 RAPIDS:使用 GPU 加速分布式海量数据处理的原理和实战 基于 GPU 加速的高性能数据科学计算环境 数据分析新速度:加速数据科学转变成商业洞察 图卷积神经网络介绍及其在 3D 点云语义分割领域的应用 网络智能化分级及验证 运营商 5G 通信网络 AI 研发与实践 在阿里云容器服务中使用 GPU 加速数据科学 AR 边缘云白皮书技术概览 GPU 加速的 GIS 数据现实平台 GPU 加速数据科学的兴起 OPTICKS:基于 NVIDIA OPTIX 的 GPU 光子模拟 RAPIDS:GPU 加速平台的内与外
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值