容器监控利器!缩短程序检测与修复时间

8777ea6c8f71c342932e0dae2a8a8306.gif

基于Amazon CloudWatch Container Insights为Amazon EKS提供的增强可观测性,亚马逊云科技针对在Amazon ECS上运行的容器工作负载,推出具有增强可观测性的Container Insight,旨在缩短整体应用程序的平均检测时间(MTTD)和平均修复时间(MTTR),从而规避影响用户体验的问题。

借助这一功能,Amazon CloudWatch和Amazon ECS可自动收集任务级别和容器级别的CPU使用率等细粒度性能指标,同时提供可视化深入探索功能以分析根本原因。由此,无需手动搜索以及深入了解应用程序架构,即可关联指标与日志和事件,极大节省时间,从而有效解决容器监控中这一关键缺陷。

下图是关于Amazon ECS中具有增强可观测性的Container Insights的简要介绍。

1ca1d39ae1150e6e871319ad6dcf3d55.png

支持用例

这一新功能支持以下用例:

  • 通过查看详细的资源使用模式和相关的遥测数据,快速识别根本原因。

  • 使用基于亚马逊云科技最佳实践的精选仪表板主动管理Amazon ECS资源。

  • 跟踪最近的部署以及部署失败的根本原因,并匹配相应的基础架构异常,以便更快发现问题并在必要时快速回滚。

  • 无需手动设置,即可轻松监控多个账户中的资源。内置的跨账户支持通过单一视图的可观测性降低运营开销。

  • 与Amazon CloudWatch其他服务(如Amazon CloudWatch Application Signals和Amazon CloudWatch Logs)集成,可无缝关联基础架构与正在运行的服务,并识别受影响的服务。

开始使用

有两种方法可以启用具有增强可观测性的Container Insights:

  1. 集群级启用:您可以分别为特定集群启用。

  2. 账户级启用:您还可以在账户级别启用,这将自动为您账户中创建的所有新集群启用可观测性。使用这种方法,无需为每个新集群手动启用,节省时间和精力。

要在账户级别启用此功能,需要导航到Amazon ECS控制台并选择“账户设置”,在“Amazon CloudWatch Container Insights可观测性”部分,显示当前处于禁用状态,随后选择“更新”。

0d2db0c5b194e2c8433ae78f9586de21.png

该页面有一个名为“增强可观测性的Container Insights”的新选项,选择该选项,然后选择“保存更改”。

4d922a95a8748aff4bf429ec765a7e9b.png

如果您需要在集群级别启用此功能,则可以在创建新集群时进行。

02e5339bf06280c61ba2413a4161cde1.png

您也可以为现有的集群启用此功能:选择“更新集群”,然后选择该选项。

77ea834c95c73696c5be839b76cec3f0.png

启用后,您可以在集群概览控制台的“指标”选项卡中查看任务级指标。要访问跨集群的健康状况和性能指标,您可以选择“查看Container Insights”,这将重新定向跳转到Container Insights页面。

c2fc14ca1f15a1833801560a5076a595.png

为了全面了解不同集群上的所有工作负载,您可以导航到Amazon CloudWatch,然后进入Container Insights。

0b4cbe7c403e8453b8a037c7a82b2b02.png

此视图通过提供蜂窝状可视化视图,直观概括地显示集群的健康状况,从而有效解决了监控集群、服务、任务和容器的难题。仪表板采用了双状态监控方法:

  1. 警报状态(红色或绿色):反映客户定义的阈值和警报,使团队能够根据其特定需求配置监控。

  2. 利用率状态(深蓝色或浅蓝色):利用Amazon CloudWatch内置的最佳实践,来监控跨容器的资源使用模式。深蓝色表示集群的利用率较高,使团队能够在潜在的资源限制影响性能之前将其主动识别出来。

比如其中一个集群出现问题,您可以将鼠标悬停在集群上,以显示从集群层到容器层的不同层级为该集群创建的所有警报。

e04959a7c97d9670deb11a97364d409c.png

您还可以选择以列表形式查看所有集群。列表形式对于跨账户可观测性至关重要,因为它可以显示集群所有权的账户ID和标签,这有助于DevOps工程师快速识别并与账户所有者协作,以解决潜在的应用程序问题。

b020139ac12bb1b7264ba687c46178ae.png

如果您想进一步探索,可以点击集群链接,将跳转至Container Insights的详细仪表板视图,它显示该集群的内存利用率出现一个峰值。

89f7b0d6b3a44e7a8dab41b700bb415d.png

您可以深入了解容器级别的详细信息,这有助于您快速识别导致这一问题的服务。

c88a09ea696db232d27ac322c322d261.png

选择“过滤器”功能,将帮助您更彻底地调查该集群中的容器、服务或任务。

9bc51d36915b8c3345e790bfe26c213f.png

如果需要深入研究应用程序日志以了解该问题的根本原因,您可以选择任务,然后选择“操作”,并选择要查看的日志。

除了使用Amazon X-Ray跟踪外,您还可以调查另外两种日志。

首先,您可以使用性能日志(包含指标数据的结构化日志)来深入探究并识别容器级别的根本原因。其次,您可以检查收集的应用程序或容器日志,这些日志能让您深入了解容器内应用程序的行为,从而帮助追踪导致任何问题的事件序列。

Amazon X-Ray:

https://aws.amazon.com/cn/xray/

本演示使用应用程序日志。

613488d2abd80acc3e36f971b485490a.png

这将简化应用程序故障排除流程。本文演示的问题是出在向第三方应用程序发出的下游调用上,这些调用返回了超时错误。

fbc1861ba30326016a11b64275b1b507.png

这一增强功能还可与Amazon CloudWatch Application Signals配合使用,以自动检测应用程序。您可以监控当前应用程序的健康状况,并跟踪应用程序相对于服务水平目标的长期性能表现。

Amazon CloudWatch Application Signals:

https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Application-Monitoring-Sections.html

service-level objectives:

https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-ServiceLevelObjectives.html

选择Amazon CloudWatch Application Signals。

a61f23273739f327997b157b1c8d5491.png

与Amazon CloudWatch Application Signals的集成提供了端到端的可视性,有助于您将容器性能与终端用户体验关联起来。

在图表中选择数据点时,您可以看到相关的跟踪信息,这些跟踪信息会显示所有相关的服务及其影响,您还可以访问相关日志以了解根本原因。

7c3393dbe687a73f767b208809de2287.png

现已推出

Amazon ECS中具有增强可观测性的Container Insights现已在所有亚马逊云科技区域推出。

立即开始使用,体验针对容器工作负载的增强可观测性。您可复制下方链接访问Amazon CloudWatch文档,了解更多信息。

Amazon CloudWatch文档:

https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContainerInsights.html

49e19a14d820860195604595adec2915.png

36412fb677cd3977c6a2a612acc5c5cd.png

edb83b5879dcbec4596f8823b3017802.png

1fdae6959519ede854e9e971156f1e8c.gif

星标不迷路,开发更极速!

关注后记得星标「亚马逊云开发者」

听说,点完下面4个按钮

就不会碰到bug了!

9405fd9b8e6cec935f5d47c261ac84b3.gif

点击阅读原文查看博客!获得更详细内容!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值