关键字: [Amazon Web Services re:Invent 2023, Amazon Elastic Compute Cloud (EC2), Network Innovation, Cloud Network, Network Performance, Network Security, Network Connectivity]
本文字数: 2200, 阅读完需: 11 分钟
视频
如视频不能正常播放,请前往bilibili观看本视频。>> https://www.bilibili.com/video/BV1PQ4y1x7fh
导读
从一开始,亚马逊云科技网络就是亚马逊云科技履行云计算承诺的基础。在本讲座中,Amazon EC2 网络和计算服务副总裁 David Brown将与您一起回顾亚马逊云科技网络的发展历史,以及亚马逊云科技网络的发展和创新是如何延续至今--帮您释放创造力,实现飞跃。David 结合现实世界中的实例和幕后观察,深入探讨了亚马逊云科技核心网络基础架构、VPC 网络、面向人工智能/机器学习的数据中心网络、安全性和全球连接性方面的最新创新。
演讲精华
以下是小编为您整理的本次演讲的精华,共1900字,阅读时间大约是10分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。
首先David Brown生动地阐述了人际关系网络的重要价值,并带领我们回顾了15世纪40年代德国的历程,以及约翰内斯·古腾堡发明革命性活字印刷术的故事。尽管印刷术的影响力无可估量,但它本身并不能保证成功,因为在当时,识字率仅仅局限于城市中的约3%的人口。然而,一些聪明的德国印刷商移居到了繁忙的地中海贸易中心威尼斯,船只将他们印刷的书籍带到了世界的各个角落,使思想得以在全球范围内传播。由此可见,具有变革性的创新需要通过网络来实现其最大效益。
从根本上讲,网络使得跨越地理限制的连接、合作和思想交流成为可能。当亚马逊创建亚马逊云科技时,他们构想了一个网络,其中的数据流量能够从点A无缝地流到点B,而客户无需担忧性能、可靠性或安全性——这都依赖于他们完全控制的亚马逊云科技骨干网络,该网络不断扩展以满足快速增长的需求。
需求激增的例子包括福克斯体育将超级碗的比特率从x gbps翻倍至2x gbps,以升级到4K视频;企业每年产生惊人的74 zettabytes的数据;以及自动驾驶汽车等新技术的出现带来了巨大的连通性需求。亚马逊云科技在过去3年里令人印象深刻地将骨干网络容量翻了一番,展示了其迅猛的增长速度。
亚马逊云科技还迅速增加了区域数量,从2006年首次推出的美国东部地区到此后启动的33个更多地区,并有计划再推出41个地区,展示了其惊人的扩张能力。额外的地区提供了更广泛的地区选择,通过可用性区域提高韧性,并通过边缘位置减少延迟。与其他云服务提供商不同,亚马逊云科技在构建区域时会精心放置多个隔离的可用性区域,这些区域相互隔开,但又足够近,以保持优秀的延迟。每个地区至少有3个不同的可用区,连接互联网骨干的传输中心,以及引入每个地区的巨大互联网容量。这种深思熟虑的设计为客户如Netflix提供了信心,使他们可以运行最关键的负载。
一些客户对延迟的要求非常低,因此亚马逊云科技推出了本地区域服务。首个本地区域位于2019年的洛杉矶,主要针对媒体和娱乐公司。例如,Netflix在亚马逊云科技上使用本地区域服务将视频编辑的往返延迟从25毫秒降至令人惊叹的1-2毫秒,这对于这类使用场景来说具有颠覆性的影响。目前,亚马逊云科技在全球拥有超过35个本地区域。
一个典型的例子是Proto Hologram公司利用亚马逊云科技的本地区域服务来渲染全息图像,以提供真实的3D人的存在的令人毛骨悚然的印象,其中低延迟对于可信度至关重要。本地区域服务使Proto能够将延迟从25毫秒降至1-2毫秒,从而创建出一个更加无缝、引人入胜的体验。
除了延迟之外,网络可用性也非常关键。许多客户,如Capital One公司,使用亚马逊云科技的Direct Connect服务完全绕过公共互联网,并通过物理光纤直接连接到全球Equinix设施内的亚马逊云科技路由器。现在,Direct Connect在全球有100多个位置支持最高达100 Gbps的速度。
今年标志着亚马逊云科技CloudFront服务的15周年,每天处理惊人的3万亿次请求。在短短5年内,CloudFront从150个点位增长到超过600个点位,并设有13个地区边缘缓存。在周四晚上的美国职业橄榄球联赛比赛中,CloudFront达到了惊人的120 Tbps峰值,展示了亚马逊Prime Video的巨大规模。
在印度迪士尼+ Hotstar流媒体平台上观看板球世界杯时,创下了5.9亿同时在线观看的纪录,这得益于CloudFront庞大的全球网络。虽然连接亚马逊云科技数据中心的问题很重要,但向最终用户提供服务同样至关重要——这是CloudFront的使命。
回顾过去,早期的长途通信使用了光学电报来手动在塔楼之间传递消息,这是不可靠和不安全的,因为消息可能被拦截。电磁铁的发明开启了电子电报的革命,首次使得远程通信变得可靠。
类似于电磁如何催化MRI等创新技术的出现,Nitro系统解锁了许多突破性的EC2功能。Nitro可以减轻主机硬件上的虚拟化开销,回收资源的同时增强安全性。这使得亚马逊云科技能够为其工作负载使用零主机资源,所有网络、存储和安全等功能都独立处理。
在没有Nitro的情况下,每个实例的网络带宽将受限于100Gbps。然而,随着Nitro的出现,网络吞吐量已经迅速从2008年C1实例的1Gbps增长到2010年CC1实例的10Gbps,再到2017年的C5实例的25Gbps,如今已经达到了C7g实例的200Gbps。这仅仅是在过去的十年多里实现了超过200倍的增长。
AI/ML工作负载对网络需求产生了巨大影响。2020年,P4d实例通过使用Nvidia A100 GPU为客户(如Anthropic)提供了400Gbps的网络连接。然而,随着生成性AI的快速发展,我们必须重新考虑云计算数据中心网络的设计,因为现在的模型需要超过10,000个GPU和宠物级规模的网络。
亚马逊云科技在2020年开始使用基于Clos拓扑的交换机来部署Ultra集群,以实现AI/ML的隔离。然而,由于前所未有的增长,我们需要重新设计为Ultra Cluster 2.0,这是一种更扁平、更宽泛的结构,专门针对ML加速器进行了优化。它可以降低延迟16%,提供高达10倍的带宽,支持每集群64,000个GPU,并实施新的路由协议,以实现在校区之间的亚秒收敛。
新的EC2实例拓扑API可以显示实例布局的可见性,使客户能够优化网络性能。传统上,TCP会选择一个单一的流路径,这有可能导致拥塞。然而,亚马逊云科技率先推出了可扩展的可靠数据报路由,该路由被弹性纤维适配器用于在不产生瓶颈的情况下在多个路径上传输流量。
SRD现在在85个使用ENA Express的实例上受到支持,将流量限制翻倍至25Gbps,同时减少尾延迟50%,而无需进行任何应用程序更改。
虽然使用VPC扩展基础设施至关重要,但管理IP地址也带来了挑战。两年前,亚马逊云科技发布了VPC IP地址管理器(IPAM),以自动化大规模客户的IP任务,如分配、跟踪和监控地址,例如AthenaHealth等客户。
今天宣布的新IPAM功能包括:增强的自动化,可以在分钟内而非周内将IP分配给VPC子网;自带自治系统号,以便企业在迁移到亚马逊云科技时能保留现有的自治系统号;以及一个新的免费层,以提供公共IP的可视性,以实现成本优化。
IPv6作为IPv4的升级版本,正逐渐成为互联网领域的未来趋势。亚马逊云科技致力于为互联网应用和大规模工作负载提供IPv6支持,以应对日益紧张的IPv4资源问题。至2023年,亚马逊云科技将推出一系列最新的IPv6增强功能,包括通过灵活编址实现连续块支持、支持端到端IPv6流量的Gateway Load Balancer以及扩展Global Accelerator的IPv6支持,使其支持的服务数量达到35项。
除了解决IPv6地址问题外,亚马逊云科技还提供了诸如Amazon VPC等工具来帮助客户构建网络拓扑。这些工具已经被许多企业,如Capital One,广泛应用于数千个VPC中。起初,亚马逊云科技曾认为客户只需要一个VPC,但后来发现这是错误的。
VPC对等连接技术实现了VPC之间的通信,但其范围仅限于大约100个VPC。直到2018年,亚马逊云科技推出了Transit Gateway,彻底改变了跨区域和客户自有设施之间数千个VPC的连接方式。此外,Transit Gateway还集成了VPN、Direct Connect等功能。
Capital One的高级副总裁Will Meyer详细介绍了该公司在亚马逊云科技上的云之旅。他们在2020年关闭了最后一个数据中心,转而优先发展效率、交付速度和创新能力。如今,Capital One已拥有庞大的规模,包括数十万个EC2实例和Lambda函数,以及通过Transit Gateway互连的约4000个VPC。
Meyer分享了他们在云化过程中的一些经验教训。首先,“可编程的基础设施就是魔法”——自动化的基础设施使得交付频率提高了10倍,同时也大幅降低了存储/计算成本,从而释放了更多的数据价值。此外,大多数新应用程序都采用了无服务器架构,通过在AZ和区域之间运行主动-主动模式,增强了弹性,减少了事故,尽管变更操作增加了三倍。
然而,复杂性仍然存在。随着他们的环境从几十个VPC增长到几千个,Capital One面临着路由限制问题,这需要重新设计架构。虽然云计算带来了自动化,但在大规模环境下处理地址管理仍然是一个挑战。Capital One期待借助亚马逊云科技的Cloud WAN来实现云原生网络。
最后,David研究了亚马逊云科技的Elastic Load Balancing,现在其每日峰值处理能力已经达到了惊人的300Tbps。通过负载均衡,可以减少优化应用程序以进行垃圾收集等操作的需求,从而实现更稳定的性能。
随着时间的推移,亚马逊云科技不断推出新功能,如跨区域负载均衡、限制爆炸范围的AZ内隔离以及最近宣布的自动异常检测。这些功能通过减少向表现不佳的目标发送流量,利用机器学习识别并减轻灰色故障。
负载均衡器在安全方面发挥着第一道防线的作用。自2011年起,亚马逊云科技开始支持TLS加密。在2014年的Heartbleed事件之后,亚马逊云科技开发了用于加强安全的开源TLS实现s2n。近期,亚马逊云科技已利用s2n安全地实现了互TLS身份验证,并与亚马逊云科技证书管理器集成。这为ALB背后的应用程序提供了基于证书的标识和互认证。
除了新功能外,亚马逊云科技关注用户体验,提供CloudFormation支持,及时更新Kubernetes用户的ALB控制器,以及支持IPv4/IPv6的双栈配置。
亚马逊云科技还重新发明了网络技术,通过VPC Lattice超越了IP地址和路由。它使服务到服务的通信变得简单,无需像Block这样的客户进行复杂的网络调整。
Block使用Lattice简化Square、Tidal和Afterpay等服务之间的跨子公司通信,而无需重构应用程序。
数据传输的安全性经历了几个世纪的发展,从古希腊的scytale到罗马密码,最终发展到Enigma加密。在20世纪70年代,加密技术进入IT领域以保护数据,推动了今天的安全在线交易。
亚马逊云科技致力于提供最安全的云环境,构建在安全基本原理上,并与合作伙伴广泛合作。在大规模运营中,亚马逊云科技拥有广泛的威胁能见度,使其能够持续将见解投资到基础设施中。
亚马逊云科技讨论了Project Mad Pot计划,该计划通过数千个诱饵吸引威胁并以获取情报。仅2023年第一季度,它就阻止了超过130万次DDoS攻击,禁用了一千多个命令和控制服务器,解散了23万个层7 DDoS机器人,并在向公司发出被入侵资源的警报的同时,与亚马逊云科技WAF、盾牌等分享见解。
尽管Mad Pot能够实现周边威胁检测,但亚马逊Network Firewall却能按需扩展以保护AthenaHealth等客户内部安全。近期的防火墙功能升级包括TLS解密/检查和基于资源标签的微分段策略,同时还支持通过防火墙管理器的多个管理员支持。
通过网关负载均衡器,客户还能依赖可靠的第三方防火墙供应商,如Palo Alto Networks,同时保持亚马逊云科技的可扩展性和可用性。亚马逊云科技、合作伙伴解决方案和混合模式在保护环境方面展现了灵活性。
零信任是一个持续发展的领域,它基于身份、设备姿态和上下文而非信任网络/IP地址来授权访问权限。去年推出的亚马逊云科技Verified Access简化了零信任部署,通过集成多因素认证、设备合规性等多个评估请求的策略。
新集成自动执行政策中的设备姿态检查,将强制分流至亚马逊云科技WAF,允许在部署前进行政策模拟,并提供可读的人类政策语言。身份和设备管理合作伙伴的集成使得客户能够利用现有系统。
总的来说,网络推动了全球交流和创新。亚马逊云科技致力于客户的发明,这从其对于现代互联网的巨大影响力中可见一斑。加密技术实现了安全的数字交易。亚马逊云科技以其惊人的规模阻止威胁,同时为客户带来最灵活和最安全的网络功能。演讲者在最后向与会者提问:在这些技术的支持下,他们将构建何物?
下面是一些演讲现场的精彩瞬间:
在2023年re:Invent上,一位领导人在向观众问好的同时,充满激情地表示他将为大家带来一场关于网络创新的演讲。
这要归功于亚马逊云科技的Local Zones技术,其低延迟特性使得Proto Hologram的逼真3D显示效果如同身临其境。
据悉,亚马逊云科技已经将其Direct Connect服务扩展到了全球100个地区,其中包括30个地区的速度高达100Gbps。
正如电报的发明开启了可靠远程通信的新时代,亚马逊云科技在增加AI训练的网络吞吐量方面也取得了显著进展,每个实例的速度已从800Gbps提升至3200Gbps。
借助Amazon E2 Instance Topology API,用户可以获取实例位置的详细信息,从而优化网络性能。
这位领导人呼吁观众们积极利用亚马逊云科技来构建他们的项目,共同迈向更美好的未来。
总结
-
在过去的三年来,亚马逊云科技的网络容量几乎翻了一番,以满足客户需求的增长。他们迅速拓展了新的区域,并专门为AI/ML工作负载构建了专门网络。同时,他们还推出了Ultra Cluster 2.0,通过优化数据中心网络实现了跨数千个GPU的高吞吐量AI/ML训练。
-
亚马逊云科技致力于简化客户的复杂网络任务。他们推出了诸如自动分配IP地址等新的VPC IP地址管理功能,并宣布推出亚马逊云科技Cloud WAN隧道连接,以便轻松集成SD-WAN设备。
-
安全性始终是亚马逊云科技关注的重点。他们利用大规模攻击的经验知识来快速创新安全服务。他们强调了新防火墙检查功能与微分段和零信任访问控制集成的优势。
总之,亚马逊云科技正大力投资于下一代网络,以提供云计算创新所需的性能、可扩展性和安全性。他们的目标是通过对网络复杂性进行抽象的服务,如VPC Lattice,使得开发人员能够在不关心网络细节的情况下进行构建。
演讲原文
https://blog.csdn.net/weixin_46812959/article/details/134675601
想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!
2023亚马逊云科技re:Invent全球大会 - 官方网站
点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!
点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!
即刻注册亚马逊云科技账户,开启云端之旅!
【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”
亚马逊云科技是谁?
亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。