Spring Cloud 链路追踪 Sleuth+Zipkin 完整教程

最新推荐文章于 2025-09-04 11:41:56 发布

原创

最新推荐文章于 2025-09-04 11:41:56 发布 · 1k 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#spring cloud

3. Spring Cloud Sleuth简介

3.1 什么是Spring Cloud Sleuth

1. 什么是链路追踪

1.1 定义

链路追踪（Distributed Tracing）是一种用于监控和分析分布式系统中请求流转过程的技术。它能够跟踪一个用户请求在整个分布式系统中的完整调用链路，包括请求经过了哪些服务、每个服务的处理时间、调用关系等详细信息。

1.2 核心作用

可视化调用链路：清晰展示请求在各个服务间的流转过程
性能监控：分析每个服务节点的响应时间和性能瓶颈
故障定位：快速定位分布式系统中的故障点
依赖关系分析：了解服务间的依赖关系和调用频率

1.3 应用场景

微服务架构中的服务调用链分析
性能瓶颈识别和优化
故障根因分析
系统健康状况监控
API调用统计和分析

2. 为什么需要链路追踪

2.1 微服务架构的挑战

在传统的单体应用中，我们可以很容易地通过日志来追踪一个请求的处理过程。但在微服务架构中，一个用户请求可能会经过多个服务，每个服务可能还会调用其他服务，形成复杂的调用链。

具体挑战包括：

调用链复杂：一个简单的用户操作可能触发十几个甚至几十个服务调用
故障定位困难：当出现问题时，很难快速定位是哪个服务环节出了问题
性能分析复杂：难以分析整个调用链的性能瓶颈
依赖关系不清晰：服务间的依赖关系复杂，难以梳理

2.2 实际问题示例

假设我们有一个电商系统，用户下单的流程可能是这样的：

用户下单请求 → 订单服务 → 库存服务 → 支付服务 → 通知服务
                ↓
            商品服务 → 价格服务
                ↓
            用户服务 → 积分服务

如果这个过程中出现了超时或错误，传统方式需要：

查看订单服务日志
查看库存服务日志
查看支付服务日志
...依此类推

这种方式效率低下，而且容易遗漏关键信息。

2.3 链路追踪的解决方案

链路追踪技术通过为每个请求分配唯一的追踪ID（Trace ID），并在整个调用链中传递这个ID，从而将分散在各个服务中的日志信息关联起来，形成完整的调用链视图。

3. Spring Cloud Sleuth简介

3.1 什么是Spring Cloud Sleuth

Spring Cloud Sleuth是Spring Cloud提供的分布式链路追踪解决方案，它能够自动为Spring Boot应用添加链路追踪功能。Sleuth实现了Google的Dapper论文中提出的链路追踪理论。

3.2 Sleuth的核心特性

自动埋点：无需手动编写代码，自动为HTTP请求、消息队列、数据库调用等添加追踪信息
与Spring生态集成：完美集成Spring Boot、Spring MVC、Spring WebFlux等
多种传输方式：支持HTTP、RabbitMQ、Kafka等多种数据传输方式
采样控制：支持灵活的采样策略，避免性能影响
可扩展性：支持自定义Span、Tag等扩展功能

3.3 支持的组件

Sleuth能够自动为以下组件添加链路追踪：

HTTP调用：RestTemplate、WebClient、Feign
消息队列：RabbitMQ、Apache Kafka
数据库：JDBC、Redis、MongoDB
缓存：Spring Cache
定时任务：@Scheduled、@Async
Web框架：Spring MVC、Spring WebFlux

4. Zipkin简介

4.1 什么是Zipkin

Zipkin是Twitter开源的分布式链路追踪系统，它能够收集、存储和展示链路追踪数据。Zipkin提供了Web UI界面，可以直观地查看调用链路、分析性能问题。

4.2 Zipkin的架构组件

Collector（收集器）：接收来自应用程序的追踪数据
Storage（存储）：存储追踪数据，支持内存、MySQL、Elasticsearch、Cassandra等
API：提供查询追踪数据的REST API
Web UI：提供用户界面，用于查看和分析追踪数据

4.3 Zipkin的优势

轻量级：部署简单，资源消耗较小
可视化：提供直观的Web界面
多语言支持：支持Java、.NET、Go、Python等多种语言
存储灵活：支持多种存储后端
社区活跃：拥有活跃的开源社区

5. 核心概念详解

5.1 Trace（追踪）

Trace表示一次完整的请求调用链，从用户发起请求到请求完成的整个过程。每个Trace都有一个唯一的Trace ID。

特点：

全局唯一标识符（通常是64位或128位的十六进制字符串）
代表一次完整的业务请求
包含多个Span

5.2 Span（跨度）

Span表示调用链中的一个操作单元，比如一次HTTP请求、一次数据库查询、一次方法调用等。

Span的属性：

Span ID：Span的唯一标识符
Parent Span ID：父Span的ID（根Span没有父Span）
Operation Name：操作名称
Start Time：开始时间
Duration：持续时间
Tags：标签，用于描述Span的额外信息
Logs：日志事件

5.3 Annotation（注解）

Annotation用于记录Span中的关键事件时间点。

标准Annotation：

cs（Client Sent）：客户端发送请求
sr（Server Received）：服务端接收请求
ss（Server Sent）：服务端发送响应
cr（Client Received）：客户端接收响应

5.4 Tag（标签）

Tag是键值对形式的元数据，用于描述Span的详细信息。

常用Tag：

http.method：HTTP方法
http.url：请求URL
http.status_code：HTTP状态码
error：错误标识
component：组件名称

5.5 示例说明

假设有一个调用链：Web服务 → 用户服务 → 数据库

Trace ID: abc123
├── Span A (Web服务处理请求)
│   ├── Span B (调用用户服务)
│   │   └── Span C (查询数据库)
│   └── Span D (返回响应)

6. Sleuth+Zipkin架构原理

6.1 整体架构

┌─────────────┐    ┌─────────────┐    ┌─────────────┐
│   服务A     │    │   服务B     │    │   服务C     │
│ (Sleuth)    │    │ (Sleuth)    │    │ (Sleuth)    │
└──────┬──────┘    └──────┬──────┘    └──────┬──────┘
       │                  │                  │
       └──────────────────┼──────────────────┘
                          │
                   ┌──────▼──────┐
                   │   Zipkin    │
                   │  Collector  │
                   └──────┬──────┘
                          │
                   ┌──────▼──────┐
                   │   Storage   │
                   │  (内存/DB)   │
                   └──────┬──────┘
                          │
                   ┌──────▼──────┐
                   │  Zipkin UI  │
                   └─────────────┘

6.2 数据流转过程

请求发起：用户发起请求到服务A
Trace创建：Sleuth在服务A中创建新的Trace和根Span
跨服务传播：服务A调用服务B时，Sleuth自动在HTTP头中传递追踪信息
Span创建：服务B接收到请求后，创建新的Span
数据上报：各服务完成处理后，将Span数据发送到Zipkin
数据存储：Zipkin将接收到的数据存储到后端存储系统
数据展示：用户通过Zipkin UI查看追踪信息

6.3 追踪信息传播机制

Sleuth通过以下方式传播追踪信息：

HTTP调用：

X-Trace-Id: abc123
X-Span-Id: def456
X-Parent-Span-Id: ghi789

消息队列： 在消息头中添加追踪信息

线程内传播： 使用ThreadLocal存储追踪上下文

7. 环境搭建

7.1 Zipkin Server搭建

方式一：使用官方JAR包

下载Zipkin JAR包

# 下载最新版本
curl -sSL https://zipkin.io/quickstart.sh | bash -s

启动Zipkin

java -jar zipkin.jar

访问Web界面

http://localhost:9411

方式二：使用Docker

# 启动Zipkin容器
docker run -d -p 9411:9411 openzipkin/zipkin

方式三：使用Docker Compose

version: '3.8'
services:
  zipkin:
    image: openzipkin/zipkin
    ports:
      - "9411:9411"
    environment:
      - STORAGE_TYPE=mem

7.2 项目依赖配置

在Spring Boot项目中添加依赖：

<dependencies>
    <!-- Spring Cloud Sleuth -->
    <dependency>
        <groupId>org.springframework.cloud</groupId>
        <artifactId>spring-cloud-starter-sleuth</artifactId>
    </dependency>
    
    <!-- Zipkin -->
    <dependency>
        <groupId>org.springframework.cloud</groupId>
        <artifactId>spring-cloud-sleuth-zipkin</artifactId>
    </dependency>
    
    <!-- Web依赖 -->
    <dependency>
        <

最低0.47元/天解锁文章