![0eea985d4d48a769ca44879d6a42d659.png](https://img-blog.csdnimg.cn/img_convert/0eea985d4d48a769ca44879d6a42d659.png)
APM现在有很多厂家在做,比如听云、云智慧、七牛云、等等吧。APM的优势就是用于故障出现时的快速分析定位,缩短故障排查的时间,把损失降到最小。当然它能做的也不止于此,只要发挥你的想象力,它能做很多数据分析的工作。
我今天要介绍的是是通过telegraf这个数据采集器将数据发送到graylog,并通过grafana + elasticsearch 数据源进行看板制作。
为啥不选择influxdb的原因,是因为数据采集量很高的时候查询速度不可忍受,而且还要多维护一个数据源。
当然你也可以选择Prometheus进行采集,不过我刚才也说了,你还要多维护一个数据源,而且也还会遇到采集数量非常高的情况下,数据查询慢的问题。
之所以选择elasticsearch就是因为它的实时响应速度,因为我们做的是APM性能看板,做不到实时反馈,就失去它的意义了。
以下是我通过grafana做的性能看板,希望能够帮助到大家。
(1)主机资源占用率分析看板,如果主机cpu、内存、告警了,你肯定想知道是哪个进程、进程id。