re:Invent 2023 | 使用弹性负载平衡器增强应用程序的安全性和可用性

关键字: [Amazon Web Services re:Invent 2023, Elastic Load Balancing, Security, Availability, Elastic Load Balancing, Features, Architecture]

本文字数: 2400, 阅读完需: 12 分钟

视频

如视频不能正常播放,请前往bilibili观看本视频。>> https://www.bilibili.com/video/BV1rC4y1S797

导读

Elastic Load Balancing (ELB) 是一个完全托管的亚马逊云科技服务组合,可在亚马逊云科技或企业内部的多个目标和虚拟设备之间自动分配传入流量。在本论坛中,您将详细了解如何构建应用程序负载平衡器、网络负载平衡器和网关负载平衡器,以及它们的扩展特性,这些特性旨在为其背后的应用程序提供高安全性和可用性。了解关键功能,包括最近推出的功能。了解可帮助您充分利用负载平衡器的常见架构模式。

演讲精华

以下是小编为您整理的本次演讲的精华,共2100字,阅读时间大约是10分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。

💡 - 亚马逊云科技的内部详情

  • 🆕 - 过去一年推出的一些新功能
  • 🔗 - 文档链接
  • 💭 - 设计考虑因素

在介绍议程之后,约翰展示了一个链接到ELB安全最佳实践文档的QR码。他还提到一份即将到来的可用性最佳实践指南也将很快发布。这表明亚马逊云科技如何根据大量的内部经验为客户提供指导。

约翰概括了他们将在三个关键领域——扩展、健康和运营——探讨可用性问题。ELB被设计成可以大规模扩展,并支持几乎所有的工作负载大小。亚马逊云科技在内部准备了大量的冗余,以实现最大程度的可用性,客户也可以实施这种冗余。

在扩展方面,约翰解释道,应用负载均衡器首先垂直扩展,随着流量增长用更大的实例替换较小的实例。一旦达到最大的实例大小,它将通过在每个可用区域内添加更多节点来进行水平扩展。

亚马逊云科技在内部分析了ELB节点的扩展情况:

  • 在几秒钟内触发扩展以在分钟内提供所需的容量
  • 在流量下降时避免快速缩小以避免振荡

约翰建议客户采用类似的方法,但具有较低的扩展阈值和较长的冷却期。作为一个具体的例子,他建议:

  • 35%的CPU利用率阈值
  • 目标每个实例50个请求
  • 15%的CPU阈值以进行规模缩小

这提供了33%的额外容量,以舒适地处理流量激增和区域故障。

相比之下,约翰解释了网络负载均衡器如何使用亚马逊云科技的Hyperplane进行透明的扩展。Hyperplane通过一个静态IP地址在主机之间分布流量。其优点包括:

健康检查、目标组故障开放阈值、DNS故障转移、跨可用区负载均衡以及异常检测。亚马逊云科技始终对所有的ELB节点进行检查,一旦发现问题节点,就会立即替换,以确保流量的快速恢复。客户需要为目标组配置健康检查设置,包括检查频率、健康和不健康阈值的检查次数以及检查间隔时间等。此外,约翰推荐只对关键依赖项进行检查,并使用HTTP over TCP来验证应用层。新增加的功能叫做目标组故障开放阈值,它可以定义一个不健康目标占所有目标的比例,从而触发对所有不健康的目标进行路由。这样,当系统过载时,可以避免故障的扩散。在实际操作中,如果设置了一个50%的阈值和总共10个目标,那么其中有9个健康目标只会被路由到健康目标,但有6个不健康目标将会超过这个阈值,导致故障转移到所有目标。因此,约翰认为这在处理过载情况下而不是故障扩散的情况下非常有帮助。在调整故障开放阈值时,约翰还建议配置DNS故障转移功能。因为ELB已经集成了Route 53的健康检查功能,可以从DNS中删除不健康的IP地址。如果在没有故障转移目标的情况下关闭了跨可用区负载均衡,那么就可以将各个区域隔离开来,从而使只有一个受损的区域受到影响,而其他健康的区域将继续接收流量。约翰还表示,这将与Route 53的应用程序恢复控制器配合使用效果最好——从ELB的DNS路由中移除不健康的区域。

约翰随后介绍了一种针对去年推出的应用负载均衡器的新功能——跨区域负载均衡关闭特性。这种功能可以防止一个区域接收到的流量离开该区域,从而将负载均衡限制在每个区域。

优势在于易于区域的隔离和故障切换。每个区域需要有足够的容量,并且每个区域都需要有目标资源。如果目标在不平衡的区域之间分布不均,跨区域关闭可能会使目标较少区域过载。约翰表示,跨区域关闭与路由53区域转换配合得很好。

转换话题,约翰讨论了异常检测,这是另一种新的ELB功能。运行状况检查可以识别硬故障,但许多问题是由性能不佳的组件引起的微妙“灰色失败”。

亚马逊云科技有一个内部系统,它会主动替换任何异常值,即使它们仍然可以通过检查。这防止了许多微妙的失败。对于ALB,新的人工自动目标权重功能提供了类似的保护。它监控目标的响应,通过乘法增加/减少来将流量从发送错误或连接失败的目标转移走。

这不会导致运行状况检查失败,因为仍会向目标发送一些流量以进行检测恢复。约翰解释说,这在测试和生产中已经非常成功地检测和减轻受损目标的问题。

如果异常主机指标高于0,则表示系统检测到需要调查的问题。约翰建议如果在看到异常,就启用自动加权功能,从目标恢复开始,以缓慢的增量增加流量。这对所有ALB路由算法和目标组都有效,有助于保持最高可用性。

对于网络负载均衡器,约翰解释称,异常检测利用了Hyperplane的可见性。不健康的主机会被检测到,使用路由53的健康检查和DNS故障切换将流量从它们的区域移走。

这将从DNS中删除不健康的区域,将流量路由到健康的区域。如果所有区域都变得不健康,只有配置了另一个端点用于故障切换时,DNS才会开放失败。

转到运营方面,约翰首先强调亚马逊云科技的目的是仅在需要人工干预时才发出警报。在启动任何系统之前,都会创建并审查运行手册,以确保即使在凌晨3点也能理解。

大多数更改都是通过CI/CD自动化的,通过自动化部署代码管道。亚马逊云科技还在团队可用的白天而不是非工作时间部署。

金丝雀验证系统是否正常运行。在每个区域和区域内进行数据平面金丝雀测试,将流量发送到所有负载均衡器。同时,控制平面金丝雀每分钟在全部区域和区域内测试所有负载均衡器的完整生命周期。通过这种方式,可以监控工作负载的健康状况(请求、流量体积)和问题(5XX错误、连接错误)。警报和仪表板提供了全面的可见性。为了应对潜在的区域问题,约翰建议按区域查看指标,并使用异常检测来处理灰色失败。他建议设置两个警报级别——低优先级异常和高优先级重大错误。警报应具有可操作性,并提供运行手册。亚马逊云科技每周审查仪表板,调查指标和警报之间的任何差距。在部署方面,亚马逊云科技从不计划停机时间。变更从小规模开始,然后谨慎地扩大。紧反馈循环在变更推出时监控指标。亚马逊云科技每天在一个区域进行部署,避免使用多个区域。严格的变更管理和自动化最大限度地减少人为错误。目标是使部署对客户产生零影响。在安全方面,萨蒂亚概述了一种深度防御方法,该方法使用网络和应用控制横跨五个领域:访问控制、加密、身份验证、配置和集成。他解释了如何在网络负载均衡器的安全组中应用这些概念,以及如何使用互惠 TLS 来解决这些问题。

客户端通过IGW访问公共子网,在此过程中,公共子网中的负载均衡器负责将流量分发给私有子网。ALB安全组仅允许来自可信来源的访问,同时采用TLS加密连接以确保数据传输的安全性。此外,还实施双向TLS以验证客户端的身份。在发送请求之前,WAF会对其进行过滤,以防止恶意攻击。IAM策略则限制了可能出现的配置错误。此外,亚马逊云科技的其他服务,如Cognito、Config和GuardDuty,也为系统提供了额外的保护。

最后,萨蒂亚探讨了如何通过第三方解决方案(如亚马逊云科技WAF)来进一步提升安全性能的方法。另一种途径是整合诸如防火墙等设备,并通过2020年推出的网关负载均衡器来实现这一目标。

客户希望能够在利用现有安全投资的同时,实现亚马逊云科技的扩展性和可用性。网关负载均衡器为作为目标的虚拟设备提供了水平扩展和高可用性,无需管理AMI的扩展和维护。流量会流向网关负载均衡器的端点,并在设备群中分布。应用场景包括:

  • 互联网流量检查,通过安全设备过滤所有入站公共流量
  • 跨多个VPC和账户的东-西交通的中央检查VPC

与亚马逊云科技的PrivateLink集成实现了2022年宣布的混合部署。在混合部署中,网关负载均衡器将企业VPN和Direct Connect流量转发到安全设备,从而为云和内部环境提供一致的威胁保护。

目前支持的一些集成包括Palo Alto、Fortinet、Netscout和Terraform。所有这些都可以通过亚马逊云科技市场获得。网关负载均衡器为客户提供了现有安全投资的集成的一种可扩展的云原生方法。

总的来说,约翰和萨蒂亚展示了一场非常信息丰富的演讲,涵盖了弹性负载平衡的可用性和安全性最佳实践以及新功能。他们分享了亚马逊云科技如何处理这些问题的内部细节,以及过去一年中推出的许多客户今天可以利用的功能。遵循他们的建议可以显著提高云中的应用弹性和安全性。

下面是一些演讲现场的精彩瞬间:

亚马逊云科技在各个区域和地区都采用了不变的数据平面探路者来监测其负载均衡器,通过分发各种类型的流量并在出现问题时向工程师发送故障页面请求。

亚马逊云科技在所有的负载均衡器上都会每分钟进行一次完整的生命周期测试,以确保其高可用性。

对于监控工作负载的正面和负面指标的讨论,这是一个非常重要的环节。

亚马逊云科技会定期进行运营审查,以便监控系统的健康状况并确保客户的满意度。

以下是一个CloudWatch仪表板屏幕截图,展示了某个应用程序负载均衡器的各项指标,包括请求数量、响应代码以及随时间推移的聚合指标。

总结

演讲者探讨了运用弹性负载均衡器(ELB)提高应用安全性和可用性的方法。他们详细阐述了亚马逊云科技如何在内部实现这些目标,同时也向客户展示了如何利用ELB的各项功能。

在可用性方面,当流量增加时,ELB会主动扩展容量,并在正常波动期间审慎地缩减规模,以确保不会丢弃流量。同时,ELB的运行状况检查会持续监控节点的运行状况,并替换任何出现故障的节点。此外,异常检测新功能可以将流量从表现不佳的目标中转移。通过跨区域提供冗余,ELB能够限制故障的影响。客户应至少为一个区域的流量激增和故障切换预留过多的容量。

在安全性方面,建议采取深度防御和网络及应用控制。ELB支持IP允许列表、TLS加密(现已包含TLS 1.3)、双向TLS认证以及防止错误配置的IAM策略。网关负载均衡器还可以与第三方安全设备,如防火墙集成。

总之,ELBs提供了强大的可用性和安全性功能,客户可以通过运用ELB的最新功能和集成来进一步提升其应用的稳定性。

演讲原文

https://blog.csdn.net/just2gooo/article/details/135114877

想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!

2023亚马逊云科技re:Invent全球大会 - 官方网站

点击此处,一键查看 re:Invent 2023 所有热门发布

即刻注册亚马逊云科技账户,开启云端之旅!

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁?

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。

  • 17
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

李白的朋友高适

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值