CMP225 | Amazon EC2 的新增功能
关键字: [Amazon Web Services re:Invent 2023, Nitro System, Ec2 Instances, Performance Improvements, Graviton Processors, Machine Learning, Cost Optimization]
本文字数: 2800, 阅读完需: 14 分钟
视频
导读
Amazon EC2 在云中提供安全的可变计算容量,并使网络规模计算变得更加容易。其是 亚马逊云科技的一项基础服务,提供各种计算实例,几乎适用于所有能想到的用例,从静态网站到按需超级计算,并且提供灵活的定价选项。本次分享介绍了 Amazon EC2 产品组合中的新增功能,包括对功能、实例系列、存储和联网功能以及边缘和混合产品的更新。
演讲精华
以下是小编为您整理的本次演讲的精华,共2500字,阅读时间大约是12分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。
未来计算:亚马逊EC2的最新进展
在2022年re:Invent上,亚马逊EC2团队的两产品负责人Art Pardo和Martin Jip发表演讲,回顾了过去一年中亚马逊EC2的最新创新。他们首先强调了令人震惊的数据,这些数据展示了过去16年里亚马逊EC2的巨大规模和爆炸式增长。自2006年首次推出以来,已经启动了超过300亿个EC2实例。如今,每天约启动1亿个实例,相当于全球每秒启动700个实例。与2018年相比,2022年客户的EC2实例启动量增加了5倍,体现了采用速度的加速。
Pardo介绍了这种巨大规模背后的原因。每天启动1亿个实例,每秒启动700个实例,这表明了亚马逊EC2所依赖的基础设施的可靠性和性能。他解释道,他们的所有工作都牢牢建立在亚马逊云科技从一开始就确立的两个核心理念上——为客户提供安全、可靠的云计算基础设施,以及以最低成本提供最佳性能。始终坚持这些原则使得EC2在创新方面取得了巨大的突破,包括重大里程碑,如2018年推出自己的Graviton ARM处理器和2016年的革命性Nitro系统。
Pardo强调,往往是那些看似微不足道的事情,比如他们对可靠性的不懈关注,才能带来未来的突破性创新。作为一个例子,他们决定设计自己的服务器以提高硬件可靠性,这让他们意识到有可能像他们的硅芯片一样定制构建更多组件。这是EC2开始了一段激动人心的旅程,从而打破了计算范式的现状。亚马逊云科技甚至持有原始专利,定义了今天在云计算中普遍使用的虚拟CPU。
在谈到亚马逊EC2的全球覆盖范围时,Pardo指出,他们已经运营了30个地区,共有96个可用区。大多数地区至少有3个可用区,这意味着在每个地理区域至少有3个独立的数据中心。这体现了他们为全球客户提供有弹性且可用的服务的承诺。
在2021年,他们设定了一个雄心勃勃的目标,即至少推出30个新的地区服务,这些地区类似于可用性区域,但位于主要大城市地区,以实现单位数毫秒的延迟。如今,全球已有25个地区服务上线,包括迈阿密、休斯顿和墨西哥城等主要枢纽。帕尔多解释道,地区服务非常适合游戏和视频流等应用,因为消除毫秒可以提供更优质的用户体验。例如,Gamestream正在使用圣保罗的EC2地区服务来减少其在巴西的云游戏服务的延迟和抖动。
亚马逊云科技并不满足于此,最近还推出了Outposts,这是一种完全管理的亚马逊云科技基础设施机架,可以虚拟地安装在任何一个地方,从边缘到现有设施的环境。这使客户能够使用相同的API和工具来管理工作负载,无论是亚马逊云科技的数据中心还是自己的设施。如纳斯达克等大型客户已经部署了Outposts来支持股票交易平台等低延迟应用程序。
然而,亚马逊云科技为什么要努力定制他们的基础设施呢?帕尔多认为这是因为可靠性和敏捷性。通过设计诸如服务器和硅等组件,而不是依赖现成的硬件,亚马逊云科技可以快速创新,无需第三方依赖就能迅速解决问题,并为云工作负载优化整个系统。
例如,亚马逊云科技开创了弹性负载平衡,这对于跨服务器扩展应用程序至关重要。他们还开发了自己的轻量级虚拟化程序,与替代品相比,它消耗的CPU资源最少,从而在高峰期以最佳效率运行客户的应用程序。
亚马逊云科技基础设施的瑰宝无疑是他们的Nitro系统。Nitro包括了将网络、存储和安全等关键功能从主CPU中剥离出来的专用卡和芯片。这使得实例更轻、更快。Nitro是亚马逊云科技能够快速推出新EC2产品的秘密武器。
帕尔多展示了一些基准数据,这些数据显示,相较于其他主要的云服务提供商,亚马逊云科技的EC2实例平均提供了约15%更高的吞吐量。通过对Redis和Memcached等进行测试,可以看出Nitro系统在真实工作负载(而不仅仅是合成的CPU性能指标)方面的优化程度,例如,在Redis工作负载上,EC2的性能提高了20-27%,而在Memcached上则提高了22%。
内托系统将任务分配给专门的硬件,如用于验证系统固件完整性的内托安全芯片。此外,还包括用于网络、存储和其他功能的内托卡。将工作从CPU中剥离出来,无论是对亚马逊云科技还是对客户都有好处——亚马逊云科技可以更灵活地修补和升级组件,而客户可以为他们的应用程序获得更多资源。
在网络方面,帕尔多概述了亚马逊云科技的网络发展历程,从2006年的1Gbps到2019年的25Gbps,再到现在的最高200Gbps。在存储方面,也经历了类似的发展过程,从磁性驱动器发展到具有加密功能的内托固态硬盘。他总结说,亚马逊云科技专为高性能和安全设计的基础设施为性能和安全性提供了最好的基础。
在安全性方面,帕尔多介绍了机密计算的概念,即保护数据免受云服务提供商和顾客之间的未经授权访问。亚马逊云科技的内托围罩允许顾客创建隔离的计算环境来处理敏感数据。例如,TradeDesk使用内托围罩来保护数字广告的个人数据,同时保持定制性。另一个构建模块是内托TPM,它可以在EC2实例上实现安全的密钥存储。
接下来,帕尔多让出了舞台,让马丁·吉普讨论EC2实例的选择范围,并重点介绍基于英特尔、AMD和亚马逊云科技自家Graviton处理器的新产品。
吉普表示,EC2提供了超过600个实例,涵盖了5个系列:通用、计算/内存优化、加速、存储优化和高性能计算。其目标是提供适用于所有可能的工作负载的定制选项。Graviton ARM实例的价格性能比x86架构高出40%。
自从2006年亚马逊云科技首次推出EC2实例以来,英特尔就一直为其提供处理器支持。如今,全球各地的各个实例家族都在使用英特尔处理器,包括通用电气、赫斯和诺华等大型品牌在内的工作负载。2022年,亚马逊云科技推出了基于第六代英特尔Ice Lake处理器的新实例,如M6id和C6id,它们具有高达7.6TB的NVMe存储,相较于前一代产品,价格性能提高了15%。此外,网络性能也得到了增强,提供了两倍带宽以及20%更高的内存速度。Jip还强调了即将推出的第四代英特尔Sapphire Rapids处理器支持的实例,如R7iz,它将提供2.6倍的vCPU和2.4倍更大的DDR5内存带宽,非常适合高性能计算工作负载。
除了英特尔,Jip还讨论了亚马逊云科技的长期合作伙伴AMD。亚马逊云科技是2018年首家推出AMD实例的主要云服务提供商。目前,超过100种EC2实例类型都在使用AMD技术,相较于类似的x86实例,每vCPU的成本降低了10%。例如,SmileDirectClub和Qlik等客户通过切换到基于AMD的EC2实例已经实现了显著的成本节省。2022年,亚马逊云科技推出了基于Milan的第六代AMD实例,包括M6a、C6a和R6a。这些新实例得益于AMD芯片架构的进步,实现了显著的世代间性能提升,其中M6a/R6a提升了35%,C6a提升了15%。此外,这些新实例还支持最高50 Gbps的快速网络连接和高达40 Gbps的EBS存储。
最后,Jip回顾了亚马逊云科技自家的Graviton芯片。2016年收购Annapurna Labs为开发Graviton系列处理器提供了关键ARM架构经验。2018年,亚马逊云科技推出了首款Graviton EC2实例,为扩展工作负载提供了出色的价格性能。2021年,亚马逊云科技推出了采用Graviton3芯片的第三代Graviton实例,相比Graviton2性能提高了25%。Graviton3还支持DDR5内存,并对浮点运算能力进行了提升,适用于数学密集型应用如高性能计算。同时,这些芯片在可持续性方面表现出色,以相同性能消耗的能源减少了60%。
据Jip表示,亚马逊云科技已提供了超过100个基于Graviton处理器的EC2实例,涵盖各个类别,还包括RDS和ElastiCache等托管服务。通过全新的Graviton快速启动计划,客户如Lambda等已成功在短短4小时内完成向Graviton的迁移。从Epic Games的《堡垒之夜》到Formula One赛车的计算流体力学,再到Airbnb的机器学习推理,各大品牌都在采用Graviton技术。
令人惊讶的是,Jip透露亚马逊云科技已与苹果展开合作,基于苹果M1芯片提供EC2实例。相较于英特尔x86 Mac迷你,基于M1的EC2实例在性能上提升了4倍。这充分体现了亚马逊云科技致力于为客户提供多样性和支持几乎所有工作负载的承诺。
在总结发言中,Jip谈到了亚马逊云科技的加速计算产品组合,包括Nvidia和AMD的GPU,Xilinx的FPGA,以及亚马逊云科技自家的定制硅片如Trainium和Inferentia,用于机器学习。随着模型变得越来越庞大和复杂,专为高性能和效率而设计的加速器变得至关重要。
Jip强调亚马逊云科技Trainium如何实现高效经济的云计算ML训练。Trn1实例配备16个Trainium芯片和高达512GB的高带宽内存。Trainium还宣称支持简单部署所需的原生框架。像Intuit这样的公司正利用Trainium进行计算机视觉工作负载。
在推理方面,Jip宣布了一款新的Inferentia 2处理器,能够实现使用数十亿参数的庞大机器学习模型上的10倍更低延迟的超快速预测。AutoDesk、Anthem和Airbnb等客户已在使用现有的Inferentia处理器进行推理,实现了显著的吞吐量提升。这为亚马逊云科技从无服务器到加速ML的端到端产品组合画上了圆满句号。
最后,Jip回到舞台中央,谈论了在经济环境中,许多客户最关心的成本优化问题。尽管创新仍在飞速发展,但亚马逊云科技致力于将节省的成本传递给客户,并提供减少浪费和过度配置的工具。
帕多详细介绍了亚马逊云科技如何通过其Cost Explorer工具来帮助用户分析和降低支出。例如,通过采用诸如EC2预留实例和Savings Plans等预先承诺方式,用户可以大幅降低每小时费用。此外,自动缩放组能够根据需求动态调整容量,而亚马逊云科技的Compute Optimizer则可以根据实际使用数据提供优化建议。
帕多还回顾了亚马逊云科技在处理器、实例类型、硅和加速器等方面的不懈创新,这些创新为客户提供了无与伦比的选择和能力。在全球范围内,亚马逊云科技提供了区域、可用区、本地地区和Outposts等多种选择,使用户能够在低延迟和数据驻留需求的任何地点部署工作负载。
自17年前创立以来,亚马逊云科技始终坚持安全、可靠、性能和效率等关键原则。这使得亚马逊云科技能够在快速发展的同时,继续保持关键任务应用程序的信任和稳定。亚马逊云科技的目标是让云变得更加简单和无缝,就像切换灯光一样,从而让客户能够专注于创造改变世界的产品和服务。从分享的数据来看,EC2已经在实现这一愿景方面取得了显著进展。
下面是一些演讲现场的精彩瞬间:
亚马逊云科技的领导者热情洋溢地欢迎参加re:Invent的观众,并与每个人进行长时间的互动,表达了她对此的兴奋。
自2006年以来,亚马逊云科技已经启动了超过300亿个EC2实例,展示了其云计算基础设施令人难以置信的可扩展性、可靠性和低成本。
如今,亚马逊每天启动的EC2实例数量已从2021年的6000万增长到2022年的1亿,突显了亚马逊云科技计算服务的快速增长和规模。
领导者解释道,亚马逊云科技的客户如何通过各种类别,如一般目的、处理器架构和管理服务等,来优化其工作负载的最佳实例选项。
Nitro系统通过加密证明提供安全性,以验证镜像并阻止受损系统启动。
亚马逊云科技已显著提高了网络性能,现在提供高达200Gbps网络速度的实例。
从GPU切换到Inferentia使得Airbnb能够把PyTorch模型的吞吐量翻倍,同时降低成本。
总结
本次演讲主要介绍了亚马逊EC2在满足客户需求方面的最新创新。亚马逊EC2致力于将云计算变得更加简单易用,就像开灯一样。演讲中强调了三个关键方面。首先,EC2具有无可匹敌的全球基础设施,包括30个区域以及每天启动超过1亿个实例,从而确保了可靠性和可用性。其次,定制亚马逊云科技硅,如Graviton处理器,能够支持专门的加速、快速创新和性能提升。最后,通过Nitro安全区和TPM实现的安全计算,保护客户数据和工作量。此外,演讲还预告了一些即将推出的EC2服务,如下一代存储、网络、机器学习和高性能计算实例。这些服务将带来更快的处理速度、更高的安全性和更环保的可持续发展。亚马逊EC2的目标是继续颠覆和革命计算领域,以实现让每个人都能在云端轻松访问的愿景。
演讲原文
想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!
2023亚马逊云科技re:Invent全球大会 - 官方网站
点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!
点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!
即刻注册亚马逊云科技账户,开启云端之旅!
【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”
亚马逊云科技是谁?
亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。