SkyWalking UI使用说明
目录
一、SkyWalking 模块介绍
- 仪表盘:
- 监控全局、服务、实例、endpoint 几个维度的运行状态。
- 拓扑图
- 以拓扑图的方式展现服务直接的关系,并以此为入口查看告警、调用链、服务状态等信息
- 追踪
- 以接口列表的方式展现,追踪接口内部调用过程,可以通过 traceid 查询,进行分布式集群的日志查看及问题排查。
- 性能剖析
- 单独端点进行采样分析,并可查看堆栈信息。
- 日志
- 包括了browser 与 service日志集合。
- 告警
- 触发告警的告警列表,包括实例,请求超时等。
二、仪表盘
从上向下介绍
- 第一栏:监控、数据库、容器、vm
- 第二栏:可以选择某个维度展示不同服务 / 实例 / 端点的数据
- 第三栏:展示的不同维度,全局、服务、实例、端点的面板。
APM 监控
APM - Global
-
Services load(CPM - calls per minute):服务平均每分钟请求数。
-
Slow Services(ms):慢响应服务,单位ms。
-
Un-Health services(Apdex):Apdex 性能指标,1为满分。
-
Slow Endpoints(ms):全局维度的慢响应端点(API)。例如一个接口,是全局Top N的数据,通过这个可以观测平台性能情况。
-
Global Response Latency(percentile in ms):全局响应延迟百分位数统计,单位 ms。
表示采集样本中某些值的占比,Skywalking 有 “p50、p75、p90、p95、p99” 一些列值。
图中的 “p99:61010” 表示 99% 请求的响应时间在61010ms以内。
而99%一般用于抛掉一些极端值,表示绝大多数请求。 -
Global Heatmap:服务响应时间热力分布图,根据时间段内不同响应时间的数量显示颜色深度
可译为热力图、热度图都可以,途中颜色越深,表示请求数越多,这和 GitHub Contributions 很像,commit 越多,颜色越深。
横坐标是响应时间,鼠标放上去,可以看到具体的数量。
通过热力图,一方面可以直观感受平台的整体流量,另一方面也可以感受整体性能。 -
底部栏:展示数据的时间区间,点击可以调整。
如果您的监控平台正常启动,监控项目也接入,但是就是没有数据,请看看是否是时区问题。