使用自定义 Grafana 面板监控 Consul
使用 Prometheus和 Grafana监控 Consul,Dashboard 中的基本都是Consul 自身的状态,除此之外,还需要一些业务相关的监控,比如当前注册的服务数量,健康和不健康的服务数量,拉取服务请求响应时间等数据
使用已有的 Dashboard
如使用 consul server 这个面板,这个面板数据非常齐全,但是在 Prometheus 中添加了任务之后,发现很多数据都没有,如集群中 server的数量 consul_serf_lan_members
这个数据,从 Consul 的 Metrics 中 http://localhost:8500/v1/agent/metrics?format=prometheus拉取也没有相关的数据,是因为Consul并没有提供相应的数据检测
针对这种问题,可以使用 consul_exporter 这个项目,该项目会通过 Consul 的API 拉取相应的数据,在整理后通过自己的接口提供相应的统计数据
- 通过 Docker 启动
docker run --name exporter -d -p 9107:9107 prom/consul-exporter --consul.server=host.docker.internal:8500
- 检查数据
curl localhost:9107/metrics
会返回相应的监控数据,这样就可以将 Consul中未提供的数据添加到 Prometheus中了
自定义监控数据
如果数据仍然不满足,可以基于consul_exporter 这个项目进行扩展,添加自定义的统计数据;如现在需要统计集群的响应时间,可以通过统计请求consul的耗时来实现:
- 添加自定义的统计项
在常量中添加一个新的统计项
responseTime = prometheus.NewDesc(
prometheus.BuildFQName(namespace, "", "response_time"),
"Time spend for a request ",
[]string{
"node", "server_ip"}, nil,
)
- 实现统计方法
func