在“分布式链路跟踪系统(一):Dapper 介绍”里提到过链路跟踪系统要解决的难题之一是“链路梳理难:需求迭代很快,系统之间调用关系变化频繁,靠人工很难梳理清楚系统链路拓扑”。
讲拓扑计算之前,先看一下分布式链路跟踪的数据模型,可以参考文章 OpenTracing 数据模型。一条 Trace(调用链)可以被认为是一个由多个 Span 组成的有向无环图,比如下面的 Trace 就是由 6 个 Span 组成的:
[Span A] ←←←(the root span)
|
+------+------+
| |
[Span B] [Span C] ←←←(Span C 是 Span A 的孩子节点, ChildOf)
| |
[Span D] +---+-------+
| |
[Span E] [Span F]
看上面的图,能够直接看到各个 Span 之间的调用关系,进一步抽象出系统之间的拓扑关系。单个 Trace 的数据未必是完整的,所以链路拓扑的计算需要汇总大量或者全部 Trace 的数据才算完整。链路拓扑可以分为两种:接口级别、应用级别,应用级别的拓扑可以在接口拓扑的基础上生成,下面先讲应用级别的拓扑