使用 Amazon Health 大规模管理资源生命周期事件

演讲介绍了亚马逊云科技Health如何帮助企业高效管理资源升级、EKS版本更新等生命周期事件,通过新功能提供可见性、简化管理和自动化通知。CoxAutomotive的案例展示了标准化通知、资源追踪和委派管理员支持的实际应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关键字: [Amazon Web Services re:Invent 2023, Amazon Health, Planned Life Cycle Events, Amazon Health, Resource Upgrades, Tracking Resource Status, Automating Notifications]

本文字数: 1600, 阅读完需: 8 分钟

视频

如视频不能正常播放,请前往bilibili观看本视频。>> https://www.bilibili.com/video/BV1KM411d7Qh

导读

您是否负责确保完成 Amazon RDS 数据库引擎升级?您的团队是否随时更新 Amazon EKS 版本?了解如何利用 Amazon Health 的新功能实现组织内计划生命周期事件的可见性并简化管理。本讲座与 Cox Automotive 合作,探讨 Amazon Health 这项功能的最佳实践和用例,以便在您的组织内大规模管理计划生命周期事件。

演讲精华

以下是小编为您整理的本次演讲的精华,共1300字,阅读时间大约是6分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。

在亚马逊云科技平台上管理各种资源生命周期事件可能对大型企业来说是一项艰巨任务,尤其是当这些资源分布在数百或数千个账户和区域时。为了协助客户顺畅地管理这些事件并降低对其服务的干扰,亚马逊云科技推出了一系列针对亚马逊云科技健康的增强功能,这些功能在本视频中得到了主讲者的详细介绍。

亚马逊云科技企业支持部的Andrew Riley先生首先发起了一项关于谁在管理类似数据库版本升级或在大型资源集上保持EKS版本最新等方面的事件时遇到困难的问题。许多参会者举起了手,确认这是一个普遍存在的问题。Andrew解释道,亚马逊云科技健康计划的生命周期事件旨在简化追踪和管理这些事件的流程,直至完成。

接着,来自Cox Automotive云计算部门的高级顾问Patty Rafferty参与了讨论。詹姆斯·艾特金(James Aitkin),亚马逊云科技健康的资深工程经理,将深入介绍新的亚马逊云科技健康功能,而Patty则将分享Cox Automotive在生命周期事件方面的经验以及亚马逊云科技健康的改进如何解决他们的挑战。

Andrew进一步阐述了生命周期事件的定义,即需要客户采取行动以避免影响服务的变更。这与亚马逊云科技处理的标准维护事件不同,后者涉及像Amazon RDS这样的托管服务,并遵循社区支持的时间表。客户必须关注即将到来的升级,测试其应用程序,并确保兼容性。例如,在2024年,需要进行像数据库证书轮换和版本升级这样的服务例行升级。随着每个生命周期事件的结束,客户需要规划下一个事件何时发生。

根据共享责任模型,亚马逊云科技负责维护云基础设施,而客户负责在云中保障自己的恢复能力。您使用的服务有责任跟上提供给您版本的更新。亚马逊云科技健康负责通知您有关事件的信息——涉及到哪些日期,您需要采取什么行动。

亚马逊云科技的Health服务通过向客户提供事件报告、提供指导和跟踪进度来帮助客户。它通过电子邮件、仪表板、EventBridge和Health API传递事件。安德鲁强调,客户应通过编程方式使用这些功能以减少人工操作。

例如,Cox Automotive利用新的EventBridge集成将亚马逊云科技Health事件纳入其Snowflake数据仓库。从那里,他们使用Lambda、S3和SQS将事件加载到仪表板和票务系统中,以在整个组织中提高可见性。

有效管理生命周期事件需要关注三个关键领域:识别、跟踪和访问。对于识别,亚马逊云科技Health通过详细的描述和文档链接与客户保持沟通。然而,客户也应有一个过程来识别受影响的资源和负责人。

Cox Automotive以前依赖于手动构建的仪表板和电子表格来识别受影响的资源。新的亚马逊云科技Health集成提供了受影响的资源的确定列表,消除了这种手动工作。

对于规划,亚马逊云科技Health旨在提供及时的通知以纳入正常周期。客户可以通过将Health数据集成到ITSM工具中来确定事件的进展。对于访问,亚马逊云科技Health增加了委托管理员支持,以便组织不需要直接管理帐户访问。事件也可以通过单个EventBridge流获取。

Cox Automotive利用委托管理员访问在整个组织中集中查看亚马逊云科技Health事件,而无需获得对核心管理帐户的权限。这实现了监督而不需要进行直接的账户管理。

詹姆斯·艾特金随后详细介绍了亚马逊云科技Health的新功能如何简化生命周期事件的管理。此前,通用的帐户通知事件使得很难识别计划的变化。冗长的文本描述解析起来很麻烦,尤其是对于自动化。在控制台仪表板中,事件仅在7天内可见,然后它们将进入事件日志。

现在,计划的生命周期事件被移动到“已安排更改”类别,并在更改的整个期间保持可见。命名标准统一为包括“计划的生命周期事件”,并且事件类型代码也反映了这一点。所有关于事件的通信都使用一个单独的事件ARN,而不是为提醒创建新的ARN。事件开始时间反映实际更改日期,而非通知发送时间。

为帮助评估影响,仪表板详细列出了受影响的资源。这些资源包括使用账户视图(针对个人账户)或组织视图(针对整个组织)的资源。具体而言,仪表板不仅列出了一般性的资源列表,还提供了完整的资源ARN,以便用户能够自动执行诸如查找所有者等操作。亚马逊云科技承诺在重大变更方面至少提前6个月通知,而在次要变更方面至少提前3个月通知。然而,在某些特殊情况下,如紧急安全升级,可能会违反这一规定。为了便于查看,一个新的日历视图展示了过去3个月内的变化以及提前最多1年的事件。

在资源跟踪方面,动态资源消耗的状态代码会显示挂起/已解决的资源。系统会每隔几小时进行一次定期扫描,并在采取相应行动时更新状态。当所有资源均显示为已解决时,活动状态将变为已完成/已关闭。此时,任何新检测到的资源将被添加回活动中。

詹姆斯通过一个示例展示了如何使用亚马逊云科技追踪RDS MySQL实例的资源消耗。如果检测到需要升级的两个实例,它们将显示为挂起状态。一旦客户升级了一个实例,亚马逊云科技健康状态就会检测到这一变化,并将状态更新为已解决。这种更新后的状态将在仪表板和API中体现出来。

在访问方面,委托管理员现在可以访问整个组织的活动和数据。一个单一的EventBridge流可以整合所有账户中的所有事件。新增了与ServiceNow和Jira Service Management的集成,使用了亚马逊云科技服务管理连接器。

来自Cox Automotive的Patty Rafferty从客户的角度介绍了如何在规模上管理生命周期事件。Cox Automotive拥有超过40,000名经销商客户,涉及北美75%的车辆交易。他们的云覆盖范围横跨500多个工作负载,分布在1,400多个亚马逊云科技账户中。

他们的云业务办公室(CBO)负责云优化、架构指导及技能提升等方面的工作。他们致力于利用改进的亚马逊云科技健康功能来现代化其生态系统。在此之前,不一致的交付时间使得规划变得困难。手动识别资源导致了在最后一刻的手忙脚乱。团队缺乏可见性以及企业级的监督也是一个挑战。

亚马逊云科技的最新Health功能有效地填补了许多空白。标准化的交付流程有助于提高预测能力。标准化的资源标识避免了手动记录。烧损追踪提供了对当地影响和进度的洞察。EventBridge集成提供了结构化数据来连接工作负载和团队。委派管理员访问使集中控制成为可能。

Cox Automotive利用EventBridge、Lambda、S3、SQS和Snowflake构建了一个集成,用于接收事件并将其与ITSM数据合并,从而创建监控仪表板。这自动化了过程并提高了运营透明度。如今,服务过滤器允许一次性筛选一个事件,而无需重新构建仪表板。详细的资料包括工作负载和团队信息,以便分配责任。

展望未来,Cox计划将其与诸如Jira或Azure DevOps等敏捷管理系统集成,以便根据亚马逊云科技Health事件为开发团队创建待办事项列表。这将使在团队每天使用的工具中直接安排工作成为可能。他们还想利用标签将事件与跨越不同视角(如服务、事件、团队和工作负载)的资源相关联。

总的来说,亚马逊云科技Health的改进为企业更有效地管理资源生命周期事件带来了更多的强大功能。标准化数据和追踪功能及时提供了即将发生的变化的可见性。像Cox Automotive这样的客户可以构建集成以实现全组织的透明度,协同ITS系统驱动规划并跟踪进度。通过更好地处理这些事件的工具,公司可以专注于业务创新,同时维护一个现代化和优化的云环境。

下面是一些演讲现场的精彩瞬间:

亚马逊云科技为其新客户提供了一个名为健康仪表板的新账户通知功能,这有助于提高对即将进行的计划内生命周期事件的可见性。

这些事件包括但不限于何时进行更改、哪些资源将受到波及以及事件的状态。

亚马逊云科技将为大型变更提供至少六个月的提前通知,而对于小型变更,则提供三个月的提前通知,以帮助客户提前做好规划。

资源状态代码可以指示是否需要继续对资源进行处理,一旦完成必要的操作,其状态将从待处理更改为已解决。

此外,对于超过最大消息大小的事件,还引入了分页功能。

在详细视图中,可以查看受EKS 1.24版本弃用影响的服务,包括负责解决问题的亚马逊云科技团队以及受影响的工作负载。

总结

视频探讨了亚马逊云科技的健康服务如何协助客户高效管理资源生命周期事件。据其说明,为了确保在亚马逊云科技上运行的服务不受影响,客户需对这些事件采取相应行动。演讲者详细描述了亚马逊云科技健康如何识别潜在事件、提供处理建议及监控进展。

亚马逊云科技健康提供标准化通知,包含受影响资源的详细信息,使客户能迅速评估影响程度。新增的资源消耗降低功能可显示待处理和已解决资源,实现跨组织追踪。借助亚马逊云科技组织部门的委派管理员支持,简化对事件的访问。客户无需管理账户便可获得整合后的视图。

视频中还展示了亚马逊云科技健康事件与其他系统如ServiceNow集成的客户案例。这有助于自动化和追踪工作任务分配给相应的团队。总之,亚马逊云科技健康致力于提供有关生命周期事件的实时、可操作数据,方便客户将其纳入常规规划流程。这样可避免紧急应对,从而更有效地管理事件。

演讲原文

https://blog.csdn.net/just2gooo/article/details/134788124

想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!

2023亚马逊云科技re:Invent全球大会 - 官方网站

点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!

点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!

即刻注册亚马逊云科技账户,开启云端之旅!

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁?

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

李白的朋友高适

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值