分布式链路追踪Spring Cloud Sleuth简介及使用

1. 问题场景

为了支撑日益增⻓的庞大业务量,我们会使用微服务架构设计我们的系统,使得我们的系统不仅能够通过集群部署抵挡流量的冲击,又能根据业务进行灵活的扩展。那么,在微服务架构下,一次请求少则经过三四次服务调用完成,多则跨越几十个甚至是上百个服 务节点。
那么问题接踵而来:

  1. 如何动态展示服务的调用链路?(比如A服务调用了哪些其他的服务—依赖关系)
  2. 如何分析服务调用链路中的瓶颈节点并对其进行调优?(比如A—>B—>C,C服务处理时间特别⻓)
  3. 如何快速进行服务链路的故障发现?

解决以上问题就是分布式链路追踪技术存在的目的和意义

2. 分布式链路追踪技术简介

如果我们在一个请求的调用处理过程中,在各个链路节点都能够记录下日志,并最终将日志进行集中可视化展示,那么我们想监控调用链路中的一些指标就有希望了,比如,请求到达哪个服务实例?请求被处理的状态怎样?处理耗时怎样?这些都能够分析出来了…
分布式环境下基于这种想法实现的监控技术就是就是分布式链路追踪(全链路追踪)。

3. 分布式链路追踪方案
  • Spring Cloud Sleuth + Twitter Zipkin 本文介绍这种方案
  • 阿里巴巴的“鹰眼”
  • 大众点评的“CAT”
  • 美团的“Mtrace”
  • 京东的“Hydra”
  • 新浪的“Watchman”
  • Apache Skywalking
4. 分布式链路追踪技术核心思想

在这里插入图片描述
上图描述了一个常⻅的调用场景,一个请求通过网关服务路由到下游的微服务-1,然后微服务-1调用微 服务-2,拿到结果后再调用微服务-3,最后组合微服务-2和微服务-3的结果,通过网关返回给用户
为了追踪整个调用链路,肯定需要记录日志,日志记录是基础,在此之上肯定有一些理论概念,当下主 流的的分布式链路追踪技术/系统所基于的理念都来自于Google的一篇论文《Dapper, a Large-Scale Distributed Systems Tracing Infrastructure》,这里面涉及到的核心理念是什么?我们继续以上面的服务调用来说明

在这里插入图片描述
上图标识一个请求链路,一条链路通过TraceId唯一标识,span标识发起的请求信息,各span通过 parrentId关联起来

Trace

服务追踪的追踪单元是从客户发起请求(request)抵达被追踪系统的边界开始,到被追踪系统向客户返回响应(response)为止的过程

Trace ID

为了实现请求跟踪,当请求发送到分布式系统的入口端点时,只需要服务跟踪框架为该请求创建一个唯一的跟踪标识Trace ID,同时在分布式系统内部流转的时候,框架失踪保持该唯一标识,直到返回给请求方。
一个Trace由一个或者多个Span组成,每一个Span都有一个SpanId,Span中会记录TraceId,同时还有 一个叫做ParentId,指向了另外一个Span的SpanId,表明父子关系,其实本质表达了依赖关系

Span ID

为了统计各处理单元的时间延迟,当请求到达各个服务组件时,也是通过一个唯一标识Span ID来标记它的开始,具体过程以及结束。对每一个Span来说,它必须有开始和结束两个节点,通过记录开始Span和结束Span的时间戳,就能统计出该Span的时间延迟,除了时间戳记录之外,它还可以包含 一些其他元数据,比如时间名称、请求信息等。
每一个Span都会有一个唯一跟踪标识 Span ID,若干个有序的 span 就组成了一个 trace。
Span可以认为是一个日志数据结构,在一些特殊的时机点会记录了一些日志信息,比如有时间戳、spanId、TraceId,parentId等,Span中也抽象出了另外一个概念,叫做事件,核心事件如下

  • CS :client send/start 客户端/消费者发出一个请求,描述的是一个span开始
  • SR: server received/start 服务端/生产者接收请求 SR-CS属于请求发送的网络延迟
  • SS: server send/finish 服务端/生产者发送应答 SS-SR属于服务端消耗时间
  • CR:client received/finished 客户端/消费者接收应答 CR-SS表示回复需要的时间(响应的网络延 迟)

Spring Cloud Sleuth (追踪服务框架)可以追踪服务之间的调用,Sleuth可以记录一个服务请求经过哪些服务、服务处理时⻓等,根据这些,我们能够理清各微服务间的调用关系及进行问题追踪分析。

5. Sleuth 使用
  1. 每一个需要被追踪踪迹的微服务工程都引入依赖坐标
<!--链路追踪-->
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-sleuth</artifactId>
</dependency>
  1. 每一个微服务都修改application.yml配置文件,添加日志级别
#分布式链路追踪
logging:
  level:
    org.springframework.web.servlet.DispatcherServlet: debug
    org.springframework.cloud.sleuth: debug
  1. 启动服务,发起请求,查看日志
2020-09-07 23:39:30.284 DEBUG [lagou-service-resume,67d5277b420015dc,67d5277b420015dc,false] 22736 --- [nio-8081-exec-2] o.s.web.servlet.DispatcherServlet        : GET "/resume/openstate/12", parameters={}
2020-09-07 23:39:30.324 DEBUG [lagou-service-resume,67d5277b420015dc,67d5277b420015dc,false] 22736 --- [nio-8081-exec-2] o.s.web.servlet.DispatcherServlet        : Completed 200 OK

如上所示,请求到来时,我们在控制台可以观察到 Sleuth 输出的日志(全局 TraceId、SpanId等)。对应的数据格式如下
[lagou-service-resume,67d5277b420015dc,67d5277b420015dc,false] ,各个位置代表的意思可以表示为
[服务名,tranceId, spanId, 是否开启日志记录],我们可以通过TraceId轻易的查询到整个请求链路上的所有日志。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值