NVIDIA GTC主题演讲内容学习<1>

57s,黄哥开始第一个主题为 I AM AI在这里插入图片描述
I am an explorer 我是探索者 -极地冰川探索,月球寻水
I am a guardian 我是守护者 -天空观测污染痕迹
I am a visionary 我是元件者 -以过往为师,模拟地球2100
I am a helper 我是助力者 -让珍贵的物种健康续存,使农作物保持丰饶
I am a healer 我是治疗者 -让医院更加智能,满足未来需求->HeratFlow
在这里插入图片描述
在这里插入图片描述
I am a creator 我是创造者 -开辟创新之路->无人机、Jesse Woolston艺术创造在这里插入图片描述
I am a storyteller 我是讲述者 -为作品赋予情感打破语言障碍
在这里插入图片描述
I am ai NVIDIA、深度学些及无所不在的人类智慧将融入我的生活
加速计算始于NVIDIA CUDA 通用可编程GPU、CUDA、提升应用运行速度的算法加速库
以及能够再整个数据中心,进行扩展处理的分布式计算系统和软件
这三者的组合是加速计算的魔力来源

<CUDA是NVIDIA推出的运算平台,并行计算架构,
该架构使GPU能够解决复杂的计算问题,
由CUDA指令架构(ISA)和GPU内部的并行计算引擎组成,
开发者可用C语言为CUDA^TM架构编写程序,并且程序可以再支持CUDA^TM的处理器上以超高性能运行>

15年以来,我们一直再推进CUDA及其生态发展
我们对“全栈”进行优化
在GPU、加速库、系统、应用方面
不断迭代更新,同时通过扩大我们加速的应用领域
来拓展平台之所及
通过我们的方法,用户能在整个产品生命周期中获得加速体验
对我们来说,在数年内通过同一块芯片为应用带来数倍性能提升
在这里插入图片描述
这中情况并不罕见
想象一下研究人员仅仅通过下载新的软件,就能将完成模拟的时间缩短一半的喜悦吧
随着我们加速的应用数量不断增多,我们的合作伙伴网络对NVIDIA平台需求也在不断增大
始于计算机图形,我们的架构,已经深入到世界上的众多大型行业之中
我们以令人惊叹的芯片为起点,在每一个科学、工业和应用的领域
我们都创建了完整的开发堆栈
我们拥有超过150个SDK,为游戏与设计、生命与地球科学
量子计算、AI、网络安全、5G和机器人等行业提供服务
今年,我们在GTC上推出了65个全新的以及更新的SDK<GTC全球商品交易中心>
设计自动化是与NVIDIA一同加速发展的主要新兴产业之一
我很高兴看到Ansys、Synopsys、Cadence和Dassault提升了对散热、机械架构
以及针对RFI及信号完整性的3D EM的模拟速度

<Ansys软件是美国ANSYS公司研制的大型通用有限元分析(FEA)软件是世界范围内增长最快的计算机辅助工程(CAE)软件,
能与多数计算机辅助设计(CAD,computer Aided design)软件接口,实现数据的共享和交换,
如Creo, NASTRAN、Algor、I-DEAS、AutoCAD等。是融结构、流体、电场、磁场、声场分析于一体的大型通用有限元分析软件。
在核工业、铁道、石油化工、航空航天、机械制造、能源、汽车交通、国防军工、电子、土木工程、造船、生物医学、轻工、地矿、水利、日用家电等领域有着广泛的应用。
ANSYS功能强大,操作简单方便,已成为国际最流行的有限元分析软件,
在历年的FEA评比中都名列第一。
中国100多所理工院校采用ANSYS软件进行有限元分析或者作为标准教学软件。>
< Synopsys是为全球集成电路设计提供电子设计自动化(EDA)软件工具的主导企业。
为全球电子市场提供技术先进的IC设计与验证平台,致力于复杂的芯片上系统(SoC)的开发。
同时,Synopsys公司还提供知识产权和设计服务,为客户简化设计过程,提高产品上市速度。>
<Cadence楷登电子是一家专门从事电子设计自动化(EDA)的软件公司,
由SDASystems和ECAD两家公司于1988年兼并而成。是全球最大的电子设计自动化(Electronic DesignAutomation)、半导体技术解决方案和设计服务供应商。>
<Dassault Systemes公司总部位于法国巴黎,
提供3D体验平台,应用涵盖3D建模,社交和协作,信息智能与内容和仿真
,产品品牌包括SolidWorks、CATIA、SIMULIA、DELMIA、ENOVIA、3DEXCITE、3DVIA、NETBIVES、GEOVIA、BIOVIA、EXALEAD>

还有一个格外令人幸福的发展是我们正在与Ansys进行的合作、这项合作会提升Ansys Fluent

Ansys Fluent流体仿真

在这里插入图片描述
这一世界领先的而工业流体模拟软件包的速度
Ansys多GPU求解器的初步成果显示,一台DGX将取代30台高端双路CPU服务器

DGX深度学习,AI人工智能GPU集群计算

在这里插入图片描述
从而大大节省系统成本与功耗
如此一来,客户便可以使用相同的总预算扩展到更大规模的模拟
如今,使用NVIDIA的开发者数量已增至300万,在过去5年中增长了6倍之多
在过去的15年里,CUDA的下载量达到了3000万次,仅去年一年的下载量就达到了700万次,加速计算的普及采用也正在加快
在这里插入图片描述
我们在全栈加速和数据中心架构方面的专业知识使我们可以帮助研究人员和开发者解决更大规模的问题,我们的计算方法十分节能高效,架构的多功能是我们能够在AI量子物理学、数字生物学、气候科学等各个领域贡献力量
如今,我们为您准备了一些出色的新加速库
首先是ReOpt,一款针对运筹优化问题
在这里插入图片描述
比如车辆线路安排和仓库拣选与包装)的加速求解器,配送14个披萨的路径有870亿种,因此对于达美乐来说,要在30分钟将披萨送达并非易事,运筹优化对于最后一公里配送来说是必须的,对于仓储及制造物流而言也是如此
路线规划是一个机器棘手的物流问题
在这里插入图片描述
应用到行业里,即使是小规模的路线优化也能节省数十亿美元
此示例使用NVIDIA Omniverse中的虚拟仓库来展示优化路线在自动订单拣选场景中带来的影响
在这里插入图片描述
优化后的规划能够使订单拣选节省一半的时间和路程
当路线优化求解器在收到新的订单后需要数小时来重新运行和响应
NVIDIA ReOpt能够持续运行并且实时动态地进行重新优化
机器人部署完毕后,收到新订单?立即重新优化
机器人离线了?立即重新优化
NVIDIA ReOpt能够在短短几秒钟内响应并且扩展到数千个位置
在这里插入图片描述
现在,我们率先捕获到显示世界的动态行为并能够通过智能且优化的方式进行响应立即重新优化您的物流

量子计算依靠的是,叠加和纠缠的自然量子物理现象,因此有潜力解决伴随组合复杂性增加而出现的问题
在世界各地的大学、科学实验室、企业和初创公司中
有近100个团队正在致力于量子处理器、系统、模拟器和算法的研究
但预计还需要十到二十年才能造出一台实用的量子计算机
同时,该行业还需要一个超高速量子模拟器来验证其研究
在这里插入图片描述
因此,我们创建了cuQuantum DGX设备,该设备配备有针对量子计算工作流的加速库
可以使用态矢量和张量网络的方法来加速量子电路模拟
Google Cirq将成为第一个得到加速的量子模拟器
加速简直妙不可言-这是量子傅里叶变换、破解公钥密码学的秀尔算法和Google Sycamore电路的结果

态矢量:量子态由希尔伯特空间中的矢量表征,称为态矢量。
该希尔伯特空间又称为态矢量空间或态空间。
以量子力学的角度来看,粒子或者系统总是处于一个概率分布的形式。
无论选取哪个物理量来进行观测,总会得到一个几率分布和不可逆地得到一个新量子态。
所以说“态”实际上是描述粒子或系统所处的状态;
某种意义上来讲就是描述选取各种各样的观测量所带来的几率分布。
而把这种概念抽象成一个名词,就是态。
张量网络理论(TNT)是一种解决物理、数学和计算机科学问题的有力方法。
<https://www.it610.com/article/1291210289806647296.htm>
<https://lujinyu.blog.csdn.net/article/details/80767255>
谷歌量子计算框架(8条消息) 谷歌开源量子计算框架Cirq_ejinxian的专栏-CSDN博客

在这里插入图片描述
曾经需要耗费几个月时间的模拟现在只需几天就可以完成
我们正在努力优化所有热门的模拟器
NVIDIA研究部门在量子算法模拟方面取得了重要的里程碑
在这里插入图片描述
我们使用1688个量子位为3375个顶点集求解MaxCut问题

MaxCut:https://blog.csdn.net/baidu_37157624/article/details/117316909?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522163660021616780255279214%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=163660021616780255279214&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~first_rank_ecpm_v1~times_rank-1-117316909.first_rank_v2_pc_rank_v29&utm_term=MaxCut&spm=1018.2226.3001.4187

这是有史以来最大的精确量子电路模拟,比以往模拟的量子位多八倍
通过DGX上的cuQuantum,量子计算机和算法研究人员可以使用当今速度最快的计算机
和未来发明的计算机
我们将在第一季度推出cuQuantum DGX设备
在这里插入图片描述
Python是科学家、机器学习与AI研究人员使用的编程语言
在这里插入图片描述
Python拥有丰富的生态系统,包括用于对DataFrame进行数据分析的Pandas

https://www.jianshu.com/p/8024ceef4fe2

用于n维数组与矩阵运算的NumPy,用于机器学习的Scikit-Learn,用于科学计算的SciPy,用于深度学习的Pytorch以及用于研究图和网络的NetworkX

NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,
支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
NumPy 的前身 Numeric 最早是由 Jim Hugunin 与其它协作者共同开发,
2005 年,Travis Oliphant 在 Numeric 中结合了另一个同性质的程序库 Numarray 的特色,
并加入了其它扩展而开发了 NumPy。NumPy 为开放源代码并且由许多协作者共同维护开发。
Scikit-learn(以前称为scikits.learn,也称为sklearn)是针对Python 编程语言的免费软件机器学习库。
它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k均值和DBSCAN,
并且旨在与Python数值科学库NumPy和SciPy联合使用。
SciPy 是一个开源的 Python 算法库和数学工具包。
Scipy 是基于 Numpy 的科学计算库,用于数学、科学、工程学等领域,
很多有一些高阶抽象和物理模型需要使用 Scipy。
SciPy 包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。
PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。
2017年1月,由Facebook人工智能研究院(FAIR)基于Torch推出了PyTorch。
它是一个基于Python的可续计算包,
提供两个高级功能:1、具有强大的GPU加速的张量计算(如NumPy)。
2、包含自动求导系统的深度神经网络。
networkx在02年5月产生,是用python语言编写的软件包,
便于用户对复杂网络进行创建、操作和学习。
利用networkx可以以标准化和非标准化的数据格式存储网络、
生成多种随机网络和经典网络、分析网络结构、建立网络模型、设计新的网络算法、进行网络绘制等。

Python拥有近2000万名用户
在这里插入图片描述
今天,我们宣布推出NumPy的插入式加速库cuNumeric
无需更改代码,cuNumeric加速了NumPy从单一GPU扩展到多GPU,扩展到多节点集群
进而扩展到世界上最大的超级计算机,其并行性以隐含的方式自动完成,cuDF与Pandas类似,cuML与Scikit-Learn类似,cuGraph与NetworkX类似,它们属于NVIDIA RAPIDS开源Python数据科学套件,RAPIDS在今年的下载量达到了50万次,比去年增长了4倍多
在这里插入图片描述
cuNumeric以Legion为基础构建,Legion以类似于现代CPU在其算术逻辑单元(ALU)和装载/存储单元(Load/Store)中调度指令的方式,在数据中心的CPU、GPU和DPU计算单元中调度任务,像自动提取指令级并行动态重新排序执行的现代乱序执行CPU一样,Legion提取任务级并行,并动态重新排序

Legion是SECFORCE的Sparta的分支,是一个开源,易于使用,超扩展和半自动化的网络渗透测试框架,
针对发现,侦察和利用漏洞的信息系统。 Legion由GoVanguard开发和维护。有关军团的更多信息,
包括产品路线图,可以在其项目页面上找到,网址为https://GoVanguard.com/legion。
如果您有兴趣为Legion贡献力量,请加入我们的Legion Keybase团队。

在这里插入图片描述
在整个数据中心调度这些任务的执行,通常是乱序执行
Legion是数据中心及的计算引擎,而cuNumeric是数据中心级的数学库,NumPy在过去5年中的下载量,达到了1.22亿次,NumPy被用于Github上的近80万个项目,开发者将因为cuNumeric的到来而欢呼雀跃,cuNumeric具有很好的可扩展性
在著名的CFD Python教学代码中,cuNumeric能够扩展至1000个GPU
在这里插入图片描述
而扩展效率仅比线性扩展效率损失了20%
ReOpt、cuQuantum、cuNumeric三个极佳的新库,让我向您展示我今天演讲的内容
我将介绍我们正在进行的重大计划以及将会重塑我们所在行业的新计划
在这里插入图片描述
您将看到的是一个永恒的主题,即如何使用Omniverse来模拟仓库、工厂、物理与生物系统、5G边缘、机器人、自动驾驶汽车、甚至虚拟形象的数字孪生,您将看到前沿的计算机图形、物理仿真和AI如何结合在一起使Omniverse成为可能,以及我们构建的计算平台和加速库如何奠定实现Omniverse的基础。
数据中心级运算、Milion-X百万倍科学加速、Omniverse、AI、虚拟形象、机器人与自动驾驶汽车,我们的GTC内容十分丰富,但在讨论数据中心之前,我向您展示我们正在构建的东西,这是一个会对话的虚拟形象,名字是Toy-Me
在这里插入图片描述
您会看见语音理解,基于目前训练的最大模型的自然语言处理,使用我自己声音合成的语音、角色动画以及基于光线追踪的精美图像,一切都是实时的,有了最近才实现的一些惊人技术Toy-Me得以打造而成,而这些技术在以前来看几乎是不肯能实现的,我邀请了几位朋友来向整个可爱的小家伙提一些棘手的问题,我们来看一下
你好
Toy Jensen,您好!
请提问
在这里插入图片描述
气候变化的最大威胁是什么?
气候变化的最大威胁是影响人类健康、食品安全、供水和环境
在这里插入图片描述
天文学家如何寻找系外行星?
大多数都是通过凌日法发现的
TRAPPIST-1行星就是通过此方法发现的
请给我讲讲这种方法
凌日法是指当一颗行星从母恒星的前方经过,天文学家通过亮度变化判断行星的大小,并通过凌日的持续时间了解行星的轨道周期
哪种望远镜使用这种方法?
开普勒太空望远镜使用凌日法,发现了数千颗系外行星,
我听说有一颗叫做TESS的卫星正被用来寻找行星,其工作原理是什么?
TESS是一种寻找凌日现象的太空望远镜
蛋白质在我们的细胞中有什么作用?
蛋白质在我们的细胞中有什么作用?
蛋白质是身体的基石,是构成所有生物的基本材料,对于身体的组织和器官正常发挥结构功能,是必不可少的
其工作原理是什么?
蛋白质由氨基酸组成,氨基酸是蛋白质的基本组成部分,20种不同的氨基酸以不同的组合连接在一起,形成了不同的蛋白质
它们如何催化化学反应?
蛋白质是生物催化剂,催化剂是一众能提高化学反应速率而不反应消耗的物质,酶是蛋白质,这种催化剂能够促进身体内的生化反应
谢谢,再见
不客气,随时为您效劳

在分布式计算中,网络是计算机的重要中枢神经系统,网络将数以千计的GPU连接成一个巨型的超级计算机,是其扩展能力和最终性能的决定因素在这里插入图片描述
今天,我们宣布推出NVIDIA Quantum-2平台,这是到目前位置最先进的端到网络平台
Quantum-2是一个400Gbps的InfiniBand平台,由Quantum-2交换机,ConnectX-7网卡、BlueField-3 DPU以及一整套面向这种新架构的软件组成

InfiniBand(直译为“无限带宽”技术,缩写为IB)是一个用于高性能计算的计算机网络通信标准,
它具有极高的吞吐量和极低的延迟,用于计算机与计算机之间的数据互连。
InfiniBand也用作服务器与存储系统之间的直接或交换互连,以及存储系统之间的互连。

Quantum-2是收割集超级计算机的性能和云计算的多租户共享能力于一身的网络平台,这是前所未有的成果,在Quantum-2之前,我们智能在裸机的高性能或安全的多租户之间选其一,无法两者兼得,Quantum-2平台的出现使您宝贵的超级计算机拥有了原生云的能力,并得到更好的优化
在这里插入图片描述
Quantum-2具备卓越的新功能,性能隔离可以防止一个租户的活动对其他租户造成干扰,基于遥测的拥塞控制机制,可以让搞数据率的发送者,避免受到网络过载的影响以及泛滥到整个网络的拥塞
在这里插入图片描述
第3代SHARP技术的交换机内计算能力比原来高32倍,以加速AI训练
纳秒级精确计时系统可以同步分布式应用程序,比如数据库处理,这可以降低所需的等待和握手的开销,避免资源竞争,纳秒计时还将允许云数据中心成为电信网络的一部分,并托管软件定义的5G无线服务,如果NVIDIA的Selene DGX超级计算机如今也配备Quantum-2,则总带宽将达到每秒224000GB/s,大约是互联网总流量的1.5倍
在这里插入图片描述
共计570亿个晶体管,采用TSMC 7nm制程和我们的A100 GPU相近
支持64个400Gbps端口或128个200Gbps端口,一个基于Quantum-2的系统可连接多达2048个端口相较800个端口的Quantum-1的交换容量多了5倍,采用Dragonfly拓扑,基于Quantum-2的网络可以仅用3个hop就扩展到100万个节点,这比前一代增加了6.5倍,
这种网络速度、交换容量和可扩展性对于需要构建的巨型HPC系统来说来得正是时候
目前Quantum-2交换机正处于样机阶段,Quantum-2平台在主机端提供两个选项:ConnectX-7和BlueField-3,ConnectX-7将是速度最快得网卡,包含80亿个晶体管,采用TSMC 7nm制程
在这里插入图片描述
ConnectX-7是目前世界上速度最快得网络芯片,比上一代ConnectX-6快两倍
同时,可使Mellanox著名的RDMA、GPU Direct Storage、GPU Direct RDMA和网络计算等性能得到加倍

Mellanox Technologies(纳斯达克股票代码:MLNX;特拉维夫证交所代码:MLNX)于1999年成立,
总部设在美国加州的圣塔克拉拉和以色列的Yokneam。
Mellanox公司是服务器和存储端到端连接解决方案的领先供应商。
Mellanox公司一直致力于InfiniBand和以太网互联产品的研发工作,公司始终坚持不断创新,
为客户提供具有高带宽,低延时、可扩展性,节能和成本优势的产品。
2010年底Mellanox完成了对著名InfiniBand交换机厂商Voltaire公司的收购工作,
使得Mellanox在HPC、云计算、数据中心、企业计算及存储市场上获得了更为全面的能力。

一个256线程的数据路径处理器,以线速进行加密,ConnectX-7将于明年1月问世
在这里插入图片描述
Quantum-2平台还提供BlueField-3 InfiniBand系列方案,通过16个64位Arm CPU来卸载和隔离数据中心基础设施栈操作
BlueField-3采用TSMC 7nm制程,包含220亿个晶体管,BlueField-3样品将于明年5月问世
NVIDIA Quantum-2是迄今为止构建的非常先进的网络平台
在这里插入图片描述
Quantum-2平台将由顶级计算机制造商提供用于全球各大超级计算中心,这将大大推动高性能计算,云计算和机器学习正在重塑数据中心,基于容器的应用为超大规模企业提供了令人难以置信的横向扩展能力,允许百万人同时使用其服务,易于横向扩展与编排的代价是东西向网络流量会随着机器与机器之间的消息传递而大幅度增加,那些分散的应用在数据中心内打开了许多端口,我们需要保护这些端口免受网络攻击,我们需要一种新型处理器来卸载CPU在处理网络、存储和安全软件方面的负担,NVIDIA的Bluefield DPU是一个基础设施计算平台,正是为此而设计在这里插入图片描述
BlueField可以卸载和加速基础设施软件,而它们通常要消耗30%的CPU资源,并且还在持续增长,对那些动辄投资数十亿美元的数据中心来说,卸载下来的算例可以极大的提升吞吐量,节约成本,BlueField的市场反响令人惊叹
今天,我们宣布推出BlueField DOCA 1.2支持全新的网络安全功能
在这里插入图片描述在这里插入图片描述
将使BlueField成为业界构建零新人安全平台的理想选择,从外围进行保护和以工作组为单位的划分的方式,已无法满足当下的安全保护需求,应用、数据、用户和设备的每个接触点都会成为潜在的攻击对象,由于BlueField是网络的端点,因此我们几乎可以在每个接触点对数据中心进行保护在这里插入图片描述
我们很高兴地宣布,领先的网络安全公司正在与我们合作,将他们的下一代防火墙

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Aniona

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值