- 什么是可观测性
可观测性是软件和系统的特性,它允许通过输出来衡量内部状态,它允许您在出现问题时询问有关系统⾏为的问题。(“为什么X坏了?” 或者“现在是什么导致了延迟?” 是可观测性可以回答的⼀些问题。)
-
为什么重要
监控这些工具和技术,只能显示和收集外部信号。与 DevOps 一样,可观测性通过提供对整个基础架构的洞察使软件工程师受益,使他们能够看到它如何因问题、部署新软件或扩展或缩减而发生变化。 -
可观测性中使用的主要数据类,如何使用
使用以下数据不能保证可观测性,尤其是独立使用或者为每个函数使用不同的工具。当您在单个解决方案中集成您的日志、指标和跟踪来实现可观测性,这样既可以了解问题何时发生,还可以立即将注意力转移到了解这些问题发生的原因上
日志
特定时间发生的事件文本记录
指标
在一段时间内的测量数值,包括特定属性 (时间戳、名称、KPI和值)
跟踪
跟踪表示请求通过分布式系统的端到端的过程。 -
如何实现可观测性
使用适当的工具对系统或者软件收集适当的遥测数据。通常包括
仪表
这些事测量工具,从容器、服务、应用程序、主机和系统的任何其他组件收集遥测数据,时间整个基础框架的可见性
数据关联
处理和关联从整个系统收集的遥测数据,创建上下文,并支持时间序列可视化的自动或自定义数据管理。
事件响应
这些自动化技术旨在根据待命时间表和技术,将有关中断的数据提供给合适的人员和团队。
AIOps
机器学习模型用于自动聚合、关联和优先排序事件数据,允许您过滤警报噪声,检测可能影响系统的问题,并在它们发生时加快事件响应。 -
良好可观测工具标准
与当前工具集成
对用户友好
提供实时数据
支持现代事件处理技术
有效的可观测性⼯具应该能够从您的堆栈、技术和操作环境中收集所有相关信息;将有价值的信号从噪⾳中分离出来,并添加⾜够的上下⽂,以便团队可以解决它。
可视化聚合数据
可观测性⼯具应该以易于理解的格式呈现洞察⼒,例如仪表板、交互式摘要和⽤户可以快速理解的其他可视化。
提供上下文
当事件发⽣时,您的⼯具应提供⾜够的上下⽂,让您了解系统性能如何随时间变化、变化与系统中的其他变化有何关联、问题的范围以及受影响服务的任何相互依赖关系或组件
使用机器学习
提供业务价值
可观测体系构建无从下手?最佳实践分享拿走不谢!-InfoQ
应云而生,一文看懂端到端的可观测体系构建-InfoQ
What is Observability? A Beginner’s Guide | Splunk