re:Invent 2023 | 混合环境的可观测性最佳实践(由 Splunk 赞助)

关键字: [Amazon Web Services re:Invent 2023, Splunk Observability Cloud, Observability, Hybrid Environments, Open Telemetry, Data Collection, Splunk]

本文字数: 1300, 阅读完需: 6 分钟

视频

如视频不能正常播放,请前往bilibili观看本视频。>> https://www.bilibili.com/video/BV1Ua4y1R7h3

导读

在混合环境中工作的团队可能会在数据一致性和上下文、可见性、可扩展性和资源管理方面遇到困难。如果不解决,这些挑战可能会导致问题检测延迟、故障排除不准确和资源紧张,从而影响整体系统性能和业务运营。本论坛概述了混合环境中可观察性的最佳实践。了解如何跨内部部署和亚马逊云科技环境聚合数据,以查看整个应用程序,无论其托管在何处,并了解如何使用 Splunk Observability 平台从一个仪表板解决多个环境中的问题。本演示文稿由亚马逊云科技合作伙伴 Splunk 为您带来。

演讲精华

以下是小编为您整理的本次演讲的精华,共1000字,阅读时间大约是5分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。

克里斯·克罗科(Chris Crocco)担任Splunk的可观察性技术外联总监。在亚马逊云科技re:Invent上,他开始了演讲。他注意到,在午餐和参观展台之后,观众们可能已经筋疲力尽,因此鼓励他们振作精神。经过几次尝试激发观众的活力后,房间内的氛围明显好转。

在观众积极参与之后,克罗科开始讨论主要议题——混合环境中的可观测性的最佳实践。他指出,对于不同人来说,“混合”可能有不同的含义。一些常见的场景包括:1)因合规性或遗留系统而导致的本地和云环境的组合;2)工作负载从本地到云的迁移;以及3)跨地理区域部署服务以实现可用性。尽管具体需求各不相同,但这些混合方法都面临着类似的长尾资产、复杂工具和缺乏可见性等挑战。

接下来,克罗科澄清了可观测性和监控之间的区别。监控是一种应对性的方法,关注的是警报和对失败的响应。可观测性则更加积极主动——衡量系统状态以确保正常运行时间和可用性。可观测性的三大数据支柱是日志、指标和追踪。日志提供“为什么”和上下文。指标显示性能。追踪说明服务之间的关系。良好的可观测性意味着你不需要不断监控和反应。

为了应对混合环境的可见性挑战,克罗科倡导使用OpenTelemetry进行数据标准化。Splunk是OpenTelemetry的领先贡献者,这是一个在环境中保持一致性的开源项目。专有代理和自定义解决方案会导致碎片化。OpenTelemetry支持一个单一的收集器管道,减少噪音,提高相关性,并消除指责。

克罗科解释了OpenTelemetry的理念,即接收器用于输入,处理器用于转换,导出器用于输出。通过在边缘进行处理,OpenTelemetry降低了流量和延迟。它允许对代码交互进行动态仪器化。Splunk Distribution of OpenTelemetry对此进行了优化,以便轻松部署。

在执行OpenTelemetry的过程中,克罗科强调了一致地使用标签和属性来跨服务传递上下文的重要性。这有助于将指标、轨迹和日志关联起来,以便快速找到问题的根源。他还建议定义诸如延迟和错误等“黄金信号”的关键指标,这些指标在所有环境中都很有用。

对于应用程序的度量,克罗科建议在可能的情况下使用自动化的库。这样可以节省时间并正确地传递上下文。他警告说,在没有进行性能测试的情况下手动仪器化、使用不受支持的头部以及在未协调的情况下自定义标签都是不可取的。标准化标签和属性对于跨应用程序和基础设施追踪工作流至关重要。

在基础设施方面,克罗科建议在日志中包含追踪ID,以便将跨度与根本原因联系起来。使用自动化在创建警报之前自行恢复。通过将检测与CI/CD版本对齐,可以更快地识别新问题。

收集数据后,克罗科建议根据时间范围和操作价值对数据进行分层。实时关键数据进入高价值系统,而合规数据可以进入较低成本的存储。将用于可观察性的日志与用于安全监控的日志分开路由。允许直接在S3等对象存储中进行搜索,而无需将所有内容索引到Splunk中。

克罗科随后展示了Splunk Observability Cloud,这是一款专为分析OpenTelemetry数据而设计的互动式服务地图,可以从代码级别开始可视化混合环境中的依赖关系。它测量部署对其他服务、客户和业务KPI的影响。基础设施监控仪表板将来自不同工具的数据集中到一个界面中。

克罗科还强调了新的Splunk功能,如用于S3的联邦搜索。这允许在Amazon S3存储桶中直接搜索数据,而无需将数据摄入到Splunk索引中。通过将数据保持在较低的S3成本中并避免重复,可以降低基础设施成本。

总之,克罗科为下一步提供了实用的建议。他邀请与会者参观Splunk展台观看演示并与专家交流。他还推荐他们尝试免费试用、访问社区论坛和学习资源,以继续探索使用Splunk的可观察性。

Chris Crocco探讨了复杂混合环境中的可观察性挑战,并提出了OpenTelemetry和Splunk Observability Cloud如何克服这些难题。通过标准化的数据收集、传递上下文、按价值分级以及整合各种工具,企业现在可以在云环境和内部部署的分布式服务中实现可见性。例如,Federated Search等创新功能进一步降低了基础设施成本。在演讲过程中,Crocco强调了实施这些解决方案的最佳实践。

从视频字幕中提取的关键数据和比例包括:

  • 常见的混合环境类型有3种:内部部署加云服务,工作负载迁移,以及地理区域部署。
  • 混合环境的挑战包括资产冗余,复杂的工具集,缺乏可见性,迁移保真度问题,以及故障点。
  • 可观察性的三个支柱包括日志,指标,和轨迹。日志提供背景信息,解释原因;指标展示性能;轨迹揭示关联。
  • OpenTelemetry支持单一收集器管道,并在边缘进行处理以减少流量和延迟。SDK和库使得仪器化成为可能。传递上下文至关重要。关键的指标如延迟和错误被称为“黄金信号”。数据按时间和价值进行分层。实时数据被传输到高价值系统,而合规数据则被传输到低成本的存储设备。通过交互式服务地图,可以查看混合依赖关系。测量服务、客户和KPI的影响。Federated Search避免了重复操作以降低成本。

通过对视频字幕中的数据进行精确提取和整合,这个总结为我们呈现了一个丰富的故事线,真实地反映了所讲述的事实内容。详细的概述展示了如何通过数据标准化、上下文传递、基础设施整合以及成本优化,OpenTelemetry和Splunk Observability Cloud如何在混合环境中提高可观察性。

下面是一些演讲现场的精彩瞬间:

领导者邀请观众们参加re:Invent的讲座,探讨在混合环境中进行可观察的最佳实践。

在这次讲座中,演讲者将解释在处理混合环境时观察与监控之间的差异。

领导者将详细阐述在支持跨混合云环境的多种服务、基础设施、数据源和故障点方面所面临的复杂性。

通过日志、事件、指标和轨迹,我们可以了解到系统的性能和故障情况。

为了充分利用这些数据,他们建议使用直接收集指标而非从日志中提取。

OTel收集器可以处理并将遥测数据导出至各种目的地,例如Splunk、亚马逊安全湖和S3等。

最后,领导者强调了Splunk的可观察性解决方案在监控应用程序、基础设施以及云迁移方面的应用。

总结

本演讲主要探讨了在混合云环境中运用开放标准(如OpenTelemetry)实现可观测性的优化策略。混合环境的复杂性,如资产间的透明度不足和监控工具的孤立,给企业带来诸多挑战。借助OpenTelemetry的通用数据格式、SDK和自动化仪表,可以在混合环境中实现数据收集的标准化和规范化。演讲中涉及的关键优化措施包括跨服务的上下文传递以维持全程可视性,对关联的标签和属性进行标准化,确定关键的监控指标即“金色信号”,并使数据分层与成本和效益保持一致。此外,演讲者还重点介绍了Splunk Observability Cloud在混合环境中对于服务监控和故障追踪的全新功能。核心观点在于,相较于被动应对问题,积极运用数据驱动的主动方法监测复杂分布式系统,OpenTelemetry和可观测性技术有助于IT团队提高系统的稳定性和降低运营成本。

演讲原文

https://blog.csdn.net/just2gooo/article/details/134818640

想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!

2023亚马逊云科技re:Invent全球大会 - 官方网站

点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!

点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!

即刻注册亚马逊云科技账户,开启云端之旅!

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁?

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。

  • 21
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值