1 分布式追踪系统
随着大量公司把单体应用重构为微服务,对于运维人员的责任就更加重大了。架构更复杂、应用更多,要从中快速诊断出问题、找到性能瓶颈,并不是一件容易的事。因此,也随着诞生了一系列面向DevOps
的诊断与分析系统,主要是以下三个系统:
- 集中式日志系统(Logging)
- 集中式度量系统(Metrics)
- 分布式追踪系统(Tracing)
三者相互交织重叠如下:
技术栈上的成熟框架有,
Logging:Log4j、ELK等,
Metrics:Prometheus、InfluxDB、Grafana等
Tracing:Jaeger和Zipkin等。
分布式追踪系统在Google发表一篇文章Dapper, a Large-Scale Distributed Systems Tracing Infrastructure后快速发展。Tracing系统一般核心步骤有三个:代码埋点、数据存储、查询展示。
历史洪流滚滚向前,大浪淘沙,现在比较流行的有Jaeger
和Zipkin
。
2 OpenTracing
由于Tracing
的技术发展迅速,为了解决兼容性问题,有了OpenTracing规范。它是一个轻量级的标准化层,连接应用、类库和追踪系统。
OpenTracing的优势:
(1)OpenTracing已经进入CNCF
(云原生计算基金会,口号是坚持和整合开源技术来编排容器作为微服务架构的一部分),正在为全球的分布式追踪,提供统一的概念和数据标准。
(2)OpenTracing通过提供平台无关、厂商无关的API
,使得开发人员能够方便添加和更换追踪系统的实现。
2.1 相关概念
Trace
:贯穿一个分布式系统的事务追踪描述,其实就是由许多个Span
组成的有向无环图。
Span
:被命名的与记录时间的调用操作,如一个Http GET请求;Span
有嵌套关系,如果一个请求会调用其