分布式链路追踪系统深入理解

Zeb-D

已于 2022-06-13 21:18:26 修改

阅读量3w

点赞数 5

分类专栏：分布式分布式中间件文章标签：分布式分布式链路链路追踪

于 2018-07-18 14:10:22 首次发布

本文为博主原创文章，未经博主[1406721322@qq.com]允许不得转载。

本文链接：https://blog.csdn.net/u014229282/article/details/81097188

版权

随着业务复杂度提升，传统日志监控无法满足分布式服务的追踪需求。本文探讨了OpenTracing规范和四种主流分布式链路追踪系统——CAT、Zipkin、Pinpoint、SkyWalking的对比分析，重点关注性能指标、侵入性、支持的技术栈和功能要求。SkyWalking在性能损耗和探针影响方面表现出色，而Pinpoint对吞吐量的影响较大。文章还讨论了技术选型的目标要求，如低损耗、无侵入性和可扩展性。

摘要由CSDN通过智能技术生成

背景

对于普通系统或者服务来说，一般通过打日志来进行埋点，然后再通过elk进行定位及分析问题，更有甚者直接远程服务器，使用各种linux命令单手操作查看日志，说到这，我也没摆脱这种困境。那么随着业务越来越复杂，企业应用也进入了分布式服务化的阶段，传统的日志监控等方式无法很好达到跟踪调用，排查问题等需求。

总之，在各种服务之间调用：

如何快速发现问题？
如何判断故障影响范围？
如何梳理服务依赖以及依赖的合理性？
如何分析链路性能问题以及实时容量规划？

如何在分布式服务进行日志监控呢？首先大家会想到分布式链路追踪系统，说到这，就得讲 OpenTracing 规范，OpenTracing 是一个轻量级的标准化层，它位于应用程序/类库和追踪或日志分析程序之间。详细介绍见 opentracing文档中文版。

在谷歌论文《 Dapper，大规模分布式系统的跟踪系统》的指导下，许多优秀的APM应运而生。分布式追踪系统发展很快，种类繁多，给我们带来很大的方便。但在数据采集过程中，有时需要侵入用户代码，并且不同系统的 API 并不兼容，这就导致了如果您希望切换追踪系统，往往会带来较大改动。OpenTracing为了解决不同的分布式追踪系统 API 不兼容的问题。

##技术调研指标

面对各种链式追踪系统开源，我们要如何选择：

我们主要关注在请求处理期间各个调用的各项性能指标，比如：吞吐量（TPS）、响应时间及错误记录等。