从 Dapper 到 OpenTelemetry：分布式追踪的演进之旅

最新推荐文章于 2025-02-14 23:51:20 发布

crossoverJie

最新推荐文章于 2025-02-14 23:51:20 发布

阅读量924

点赞数 25

文章标签：分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_18661793/article/details/139538363

版权

在之前写过两篇比较系统的关于 OpenTelemetry 的文章：

从基本概念到如何部署 demo 实战了解 OpenTelemetry，从那个 demo 中也可以得知整个 OpenTelemetry 体系的复杂性，包含了太多的组件和概念。

为了能更清晰的了解每个关键组件的作用以及原理，我打算分为几期来讲解 OpenTelemetry 的三个核心组件：

Trace
Metrics
Logs

首先以 Trace 讲起。

Trace

开始之前还是先复习一下 Trace 的历史背景。

如今现代的分布式追踪的起源源自于 Google 在 2010 年发布的一篇论文：

Dapper, a Large-Scale Distributed Systems Tracing Infrastructure

在这篇论文中提出了分布式追踪的几个核心概念：

Trace
Span
- Span 的一些基础数据结构
可视化追踪以及展示

之后 Twitter 受到了 Dapper 的启发开源了现在我们熟知的 Zipkin，包含了存储和可视化 UI 展示我们的追踪链路。

Uber 也在 2015 年开源了 Jaeger 项目，它的功能和 Zipkin 类似，但目前我们用的较多的还是 Jaeger；现在已经成为 CNCF 的托管项目。

之后陆续出现过 OpenTracing 和 OpenCensus 项目，他们都企图统一分布式追踪这一领域。

直到 OpenTelemetry 的出现整合了以上两个项目，并且逐渐成为可观测领域的标准。

更多历史背景可以参考之前的文章：OpenTelemetry 实践指南：历史、架构与基本概念

这里我们结合 Dapper 论文中的资料进行分析，在这个调用中用户发起了一次请求，内部系统经历了 4 次 RPC 调用。

从第二张图会看到一些关键信息：

spanName
parentId
spanId

parentId 很好理解，主要是定义调用的主次关系；要注意的是并行调用时 parentId 是同一个。

spanId 在可以理解为每一个独立的操作，在这里就是一次 RPC 调用；同理一次数据库操作、消息的收发都是一个 span。

span 的更多内容在后文继续讲解。

Span

当我们把某一个具体的 span 放大会看到更加详细的信息，其中最关键的如下：

traceId
spanName
spanId
parentId
开始时间
结束时间

由于一个完整的 trace 链路由 N 个 span 组成，所以这个链路必须得有一个唯一的 traceId 将这些 span 串联起来。这样才可以在可视化的时候更好的展示链路信息。

以上的这些字段很容易理解，都是一些必须的信息。

在 Dapper 论文中使用 Annotations 来存放 span 的属性，也就是刚才那些字段，当然也可以自定义存放一些数据，比如图中的 "foo"。

OpenTelemetry 中的 Span

OpenTelemetry 的 trace 自然也是基于 Dapper 的，只是额外做了一些优化，比如在刚才那些字段的基础上新增了一些概念：

{
  "name": "/v1/sys/health",
  "context": {
    "tr

最低0.47元/天解锁文章

博客等级

码龄11年

248
原创

1279
点赞

1386
收藏

1129
粉丝

关注

私信

热门文章

分类专栏

SSM 18篇
日常记录 14篇
sbc 7篇
算法 5篇
Java 进阶 55篇
volatile 1篇
concurrent 14篇
Spring 4篇
Redis 4篇
Netty 15篇
Guava 3篇
JVM 8篇
Kafka 3篇
SpringBoot 2篇
年度总结

最新评论

实操 OpenTelemetry：通过 Demo 掌握微服务监控的艺术
tyq1: 要跑起来这里提到的opentelemetry的demo，k8s集群规模得多个才行？
OpenTelemetry 实战：从零实现应用指标监控
普通网友: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
从Helm到 Operator：Kubernetes应用管理的进化
穷苦书生_万事愁: 博主的文章真是让人眼前一亮，对于 Kubernetes 应用管理的进化历程，博主从 Helm 到 Operator 进行了深入浅出的解读，让我对这个主题有了全新的认识。文章中的细节描写非常到位，展现了博主的深厚功底和对技术的热爱。期待博主未来能够持续分享更多优质文章，希望能够得到博主的指导，共同进步。在此感谢博主的辛勤分享和支持！
技术阅读周刊第十四期：Golang 作者 Rob Pike 在 GopherConAU 上的分享
CSDN-Ada助手: Go 技能树或许可以帮到你：https://edu.csdn.net/skill/go?utm_source=AI_act_go
用位运算为你的程序加速
Scora_liu: 引用「i, _ := st」这个i后面加个,_是什么意思呀？求大佬解疑惑

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。