重磅 | 最全PPT实录!英伟达发布可编程AI推理加速器TensorRT


作者 | 鸽子



2017年9月26日,英伟达GPU技术峰会GTC CHINA在北京开幕。英伟达创始人兼CEO黄仁勋发表主旨演讲《AI 的趋势、挑战与机遇》


在他的演讲中,黄仁勋提到BAT已在各自的云服务中采用NVIDIA Volta GPU,研究人员和初创公司现在也开始租用云端最先进的AI基础设施,免去了建造超级计算机的复杂性和高昂费用。


此外,他还提到华为、浪潮、联想已采用NVIDIA基于HGX的GPU服务器,而对于需要专用AI超级计算机的企业,英伟达正在与中国主要的系统集成商展开合作,提供全面优化的服务器。


他指出,NVIDIA将积极投入,全力推进“统一架构”CUDA GPU计算。通过Inception计划,将支持1900家初创公司创建AI未来。


而在网络设计方面,黄仁勋强调,AI推理平台必须具备可编程性才能运行种类繁多且不断演进的网络架构。新的架构、更深的网络、新的分层设计会继续提升CNN性能。


除此,他还展示了自动驾驶平台NVIDIA Drive,全球首款自主机器处理器Xavier;能够实时训练机器人的模拟环境 Isaac Lab。


最被大家所期盼的,则是黄仁勋对NVIDIA TENSORRT 3的宣布。


TensorRT是全球首款可编程AI推理加速器,可编程,支持所有框架,并能加速现有和未来的网络架构。它可编译到广泛的目标CUDA GPU中,从120 TOPS到1 TOPS,从250瓦到低于1瓦。


TensorRT适用于CUDA GPU的优化神经网络编译器,它可利用CUDA深度学习指令集创建运行时。它可确定每个目标GPU的最佳策略,对数值精度、网络层和张量的去除及融合、快速内核以及内存管理进行优化。从云、数据中心、PC、汽车到机器人,皆能在NVIVIA全系列平台编译出最优运行时。


有意思的是,在对比了CPU和GPU+TensorRT的性能后,黄教主张开双臂深情地大声呼吁:“the more GPU you buy, the more money you save。” (你买GPU买得越多,越省钱)


然后多次在演讲中重复了GPU给你省钱这句话,惹得台下笑声一片。


也就是在黄教主在台上“指点江山,挥斥方遒”时,网络上不少人将目光集中到他的皮衣上了。


“去年也是皮衣,真是对皮衣情有独钟啊,求淘宝地址”


“皮衣真乃黄教主的战斗马甲”


“黄教主你夏天也穿皮衣出战吗?”


关于今天的GTC大会,也有不少业内人士点评到,远没有此前美国GTC那场爆点多,当时宣布Volta架构才真是屌!


好了,以下为现场老黄演讲的PPT实录,供您参考:






AI公开课


主题:让机器读懂你的意图——人体姿态估计入门

时间:9月26日晚8点

嘉宾:曾冠奇,便利蜂智能零售实验室团队负责人

内容:

  • 人体姿态估计在新零售的应用点

  • 人体姿态估计的整个知识结构树

  • 人体姿态估计一个流派的论文、算法和代码解析

扫码报名


主题:深度学习中基础模型性能的思考和优化

时间:已结课(可看复播)

嘉宾:吴岸城 菱歌科技首席算法科学家

扫码学习:


主题:XGBoost模型原理及其在各大竞赛中的优异表现

时间:已结课(可看复播)

嘉宾:卿来云 中科院副教授

扫码学习:


主题:深度学习入门及如何转型AI领域

时间:已结课(可看复播)

嘉宾:覃秉丰 深度学习技术大咖

扫码学习:


以上课程都是免费的哦,快上车~~


 ☞ 点赞和分享是一种积极的学习态度。

NVIDIA GTC CHINA 2019 大会PPT汇总,共92份。 包括但不限于一下内容。 一、人工智能与深度学习 超越黑匣子:为深度学习注入结构 持久性 CUDA GPU 编程及其应用 从框架到平台,AWS 的深度学习实践 大规模算力平台构建和多机多卡线性扩展 滴滴端到端语音 AI 技术实践——从算法到应用 飞桨大规模分布式训练与应用 分析深度学习网络模型及自动混合精度以优化性能 基于 GPU 的 AI 计算优化方法及案例:从训练到推理 基于 GPU 的大规模音频理解和合成解决方案 基于 GPU 的大规模语言模型加速 基于 OCR 案例的 TENSORFLOW-TENSORRT(TF-TRT) 最佳实践 基于 T4 的推荐系统推理性能优化 基于 TACOTRON2 和 WAVEGLOW 的端到端语音合成加速方案 基于 TENSORFLOW 的 TRANSFORMER 模型应用与优化 计算新纪元下金融 AICC 的全双工全场景 金融行业图像识别及结构化内容抽取的 AI 应用实践 利用 TENSORRT 自由搭建高性能推理模型 美团面向生活服务场景的计算机视觉研发和应用 面向量化分析师的 GPU 加速 PYTHON 人工智能,从表型组到基因组 人工智能数据管道与应用 人工智能在医学图像临床诊断中应用研究 深度学习的对抗安全理论与方法 深度学习在心脑血管分割中的应用 深度语义匹配模型在搜狗搜索中的实践 生活服务领域知识图谱的构建及应用 使用自动混合精度加速 PADDLEPADDLE 训练 数字生命与数据自由—— GPU 加速健康大数据分析 通过 GPU 计算和深度学习加速基因分析 针对深度学习的汇编级优化-快速提高应用性能 二、智能机器、物联网和机器人 为自主机器打造的 JETSON AGX平台 ET 自动驾驶计算平台演进 三、专业视觉可视化 《光明记忆》RTX光线追踪制作经验 《剑侠情缘网络版叁》:使用实时光线追踪技术进行画质革新 超高分辨率在媒体和娱乐行业中的应用及其优化方法 光线追踪技术带来设计变革-使用QUADRO RTX GPU优化工业设计流程 基于 RTX 的云端实时渲染以及云端虚拟工作室 基于 UNITY 高清渲染管线的实时光线追踪技术介绍 基于视频信息指导的智能编舞系统 可视化技术带来产品和建筑设计的新纪元 利用 AI 技术改变视频的制作流程 利用 RTX 实现虚拟现实中的仿真渲染 人工智能运动场:提高人类的创造力 软硬件环境对建筑结构流程管理(BIM)效率的影响 商业化视频内容识别的算法设计与应用 实时光线追踪基础 使用 NVIDIA DATA SCIENCE WORKSTATION 加速数据科学实时案例分析 虚幻引擎实时光线追踪技术开启 CG 制作新时代 正在改变影视行业的 GPU 驱动的影像质量优化 四、自动驾驶汽车 大规模深度学习加速自动驾驶落地 深度学习平台在汽车智能战略中的应用 自动驾驶统一架构 五、HPC与超级计算 带有 OPENACC 和 CUDA 库的 VASP 中的新 GPU 功能 当 MARS 遇上 RAPIDS:使用 GPU 加速分布式海量数据处理的原理和实战 基于 GPU 加速的高性能数据科学计算环境 数据分析新速度:加速数据科学转变成商业洞察 图卷积神经网络介绍及其在 3D 点云语义分割领域的应用 网络智能化分级及验证 运营商 5G 通信网络 AI 研发与实践 在阿里云容器服务中使用 GPU 加速数据科学 AR 边缘云白皮书技术概览 GPU 加速的 GIS 数据现实平台 GPU 加速数据科学的兴起 OPTICKS:基于 NVIDIA OPTIX 的 GPU 光子模拟 RAPIDS:GPU 加速平台的内与外
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值