- 背景
服务可观测性,预测与发现系统性能瓶颈,透视系统状态,为系统调优和查故障提供可靠数据支撑 - 参考和关键词
参考资料: https://www.cnblogs.com/erda/p/15204516.html
Metrics
Metrics 计算 Events 发生数量的数据集,这些数据通常具有原子性,且可以聚合。从操作系统到应用程序,任何事物都会产生 Metrics 数据,这些数据可以用来度量操作系统或应用程序是否健康,或者是用以计算一段时间内请求的平均延时。
Logging
记录离散 Events,Logging 描述的是一些列离散事件,在缺乏有力的监控系统时,Logging 数据通常是工程师在定位生产问题时最直接的手段。如果说 Metrics 可以告诉你系统或者应用程序出现问题,那么 Logging 就可以告诉你为什么会出现问题。关于日志的采集现在也有很多方法,比如:filebeat, fluented, loki 等。
Tracing
• 记录应用程序操作的数据
• 一次请求的完整生命周期
• 分布式系统中一次请求经历过多个服务产生操作的数据(Spans)
Tracing 是通过有向无环图的方式记录在分布式系统中发生的 Events 之间的因果关系。云原生场景下,多个服务之间或多或少存在着依赖关系,一次 Tracing 通常会经过多个服务(Span),甚至在高度复杂的分布式系统中,一次 Tracing 包含数以万计的 Span 也是可能存在的。再者,Tracing 更多的是关注这种端到端系统之间的联系,基于该需求,分布式追踪系统应运而生。 - 规划特性
监控门户,统一监控门户,用户自定义视图
微服务可观测平台设计-总体设计
于 2021-10-30 11:08:01 首次发布
本文介绍了微服务可观测平台的设计,包括服务日志、服务链路跟踪、监控门户和性能metrics。服务日志采用切面注解进行拦截,存储在Elasticsearch,支持tracingId。服务链路跟踪使用Open Zipkin,数据存储同样在Elasticsearch。业务metrics通过Micrometer框架,指标输出到Prometheus。性能metrics基于Sentinel Dashboard进行改造,数据持久化在Elasticsearch,并发送至Prometheus。
摘要由CSDN通过智能技术生成