微服务学习笔记-如何搭建一套服务追踪系统

最新推荐文章于 2021-08-24 11:17:05 发布

dxx707099957

最新推荐文章于 2021-08-24 11:17:05 发布

阅读量260

点赞数

分类专栏：微服务

本文链接：https://blog.csdn.net/dxx707099957/article/details/108076234

版权

微服务专栏收录该内容

21 篇文章 1 订阅

订阅专栏

服务追踪系统包含三个部分：

埋点数据收集，负责在服务端进行埋点，来收集服务调用的上下文数据。
实时数据处理，负责对收集到的链路信息，按照traceId和spanId。
数据链路展示，把处理后的服务调用数据，按照调用链的形式展示处理。

OpenZipkin

OpenZipkin是Twitter开源的服务追踪系统。

OpenZipkin主要由四个核心部分组成：

Collector：负责收集探针Reporter埋点采集的数据，经过验证处理并建立索引。
Storage：存在服务调用的链路数据，默认使用的是Cassandra，是因为Twitter内部大量使用了Cassandra，你也可以替换成Elasticsearch或者MySQL。
API：将格式化和建立索引的链路数据以API的方式对外提供服务，比如被UI调用。
UI：以图形化的方式展示服务调用的链路数据。

工作原理如图所示：

通过业务的HTTP Client前后引入服务追踪代码，这样在HTTP方法“/foo”调用前，生成trace信息：TraceId：aa、SpanId:6b、annnotation：GET/foo，以及当前时刻的timestamp：1483945573944000，然后调用结果返回后，记录下耗时duration，之后再把这些trace信息和duration异步上传给Zipkin Collector。

Pinpoint

Pinpoint是Naver开源的一款深度支持Java语言的服务追踪系统。

Pinpoint主要由四个部分组成：

Pinpoint Agent：通过Java字节码注入的方式，来收集JVM中的调用数据，通过UDP协议传递给Collector，数据采用Thrift协议进行编码。
Pinpoint Collector：收集Agent传过来的数据，然后写道HBase Storage。
HBase Storage：采用HBase集群存储服务调用的链路信息。
Pinpoint Web UI：通过Web UI展示服务调用的详细链路信息。

工作原理如图：

请求进入 TomcatA，然后生成 TraceId：TomcatA^ TIME ^ 1、SpanId：10、pSpanId：-1（代表是根请求），接着 TomatA 调用 TomcatB 的 hello 方法，TomcatB 生成 TraceId：TomcatA^ TIME ^1、新的 SpanId：20、pSpanId：10（代表是 TomcatA 的请求），返回调用结果后将 trace 信息发给 Collector，TomcatA收到调用结果后，将 trace 信息也发给 Collector。Collector 把 trace 信息写入到 HBase中，Rowkey 就是 traceId，SpanId 和 pSpanId 都是列。然后就可以通过 UI 查询调用链路信息了。

选型对比

1、埋点探针支持平台的广泛性

OpenZipkin和Pinpoint都支持哪些语言平台？

OpenZipkin 提供了不同语言的 Library，不同语言实现时需要引入不同版本的 Library。官方提供了 C#、Go、Java、JavaScript、Ruby、Scala、PHP 等主流语言版本的Library，而且开源社区还提供了更丰富的不同语言版本的 Library。
Pinpoint 目前只支持 Java 语言。

2、系统集成难易程度

以 OpenZipkin 的 Java 探针 Brave 为例，它只提供了基本的操作 API，如果系统要想集成Brave，必须在配置里手动里添加相应的配置文件并且增加 trace 业务代码。具体来讲，就是你需要先修改工程的 POM 依赖，以引入 Brave 相关的 JAR 包。

<dependencyManagement>
    <dependencies>
        <dependency>
            <groupId>io.zipkin.brave</groupId>
            <artifactId>brave-bom</artifactId>
            <version>${brave.version}</version>
            <type>pom</type>
            <scope>import</scope>
        </dependency>
    </dependencies>
</dependencyManagement>

然后假如你想收集每一次 HTTP 调用的信息，你就可以使用 Brave 在 Apache Httpclient基础上封装的 httpClient，它会记录每一次 HTTP 调用的信息，并上报给 OpenZipkin。

httpclient =TracingHttpClientBuilder.create(tracing).build();

而 Pinpoint 是通过字节码注入的方式来实现拦截服务调用，从而收集 trace 信息的，所以不需要代码做任何改动。Java 字节码注入的大致原理你可以参考下图。

JVM 在加载 class 二进制文件时，动态地修改加载的 class 文件，在方法的前后执行拦截器的 before() 和 after() 方法，在 before() 和 after() 方法里记录trace() 信息。而应用不需要修改业务代码，只需要在 JVM 启动时，添加类似下面的启动参数就可以了。

-javaagent:$AGENT_PATH/pinpoint-bootstrap-$VERSION.jar
-Dpinpoint.agentId=<Agent's UniqueId>
-Dpinpoint.applicationName=<The name indicating a same service (AgentId collection)

从系统集成难易程度上看，Pinpoint 要比 OpenZipkin 简单。

3、调用链路数据的精确度

从下面这张 OpenZipkin 的调用链路图可以看出，OpenZipkin 收集到的数据只到接口级别，进一步的信息就没有了。

再来看下 Pinpoint，因为 Pinpoint 采用了字节码注入的方式实现 trace 信息收集，所以它能拿到的信息比 OpenZipkin 多得多。从下面这张图可以看出，它不仅能够查看接口级别的链路调用信息，还能深入到调用所关联的数据库信息。

同理在绘制链路拓扑图时，OpenZipkin 只能绘制服务与服务之间的调用链路拓扑图，比如下面这张示意图。

而 Pinpoint 不仅能够绘制服务与服务之间，还能绘制与 DB 之间的调用链路拓扑图，比如下图。

从调用链路数据的精确度上看，Pinpoint 要比 OpenZipkin 精确得多。

总结

从选型的角度来讲，如果你的业务采用的是 Java 语言，那么采用 Pinpoint 是个不错的选择，因为它不需要业务改动一行代码就可以实现 trace 信息的收集。除此之外，Pinpoint不仅能看到服务与服务之间的链路调用，还能看到服务内部与资源层的链路调用，功能更为强大，如果你有这方面的需求，Pinpoint 正好能满足。
如果你的业务不是 Java 语言实现，或者采用了多种语言，那毫无疑问应该选择OpenZipkin，并且，由于其开源社区很活跃，基本上各种语言平台都能找到对应的解决方案。不过想要使用 OpenZipkin，还需要做一些额外的代码开发工作，以引入 penZipkin提供的 Library 到你的系统中。
除了 OpenZipkin 和 Pinpoint，业界还有其他开源追踪系统实现，比如 Uber 开源的Jaeger，以及国内的一款开源服务追踪系统 SkyWalking。

dxx707099957

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
微服务学习笔记-如何搭建一套服务追踪系统

服务追踪系统包含三个部分：埋点数据收集，负责在服务端进行埋点，来收集服务调用的上下文数据。实时数据处理，负责对收集到的链路信息，按照traceId和spanId。数据链路展示，把处理后的服务调用数据，按照调用链的形式展示处理。OpenZipkinOpenZipkin是Twitter开源的服务追踪系统。OpenZipkin主要由四个核心部分组成：Collector：负责收集探针Reporter埋点采集的数据，经过验证处理并建立索引。 Storage：存在服务调用的链路数据，默认
复制链接

扫一扫