最近公司需要一套通用的监控系统,对监控系统进行了一些调研,最后在网上搜索资料和同事讨论中知道了open-falcon(小米开源)监控系统,这是一套针对于互联网的监控,看了设计原理和一些特性,觉得非常不错,现在已经上线并试用。跟大家分享一下open-falcon的使用和配置方法
简介
open-falcon将监控数据都抽象成key-value的形式,所以无论你是监控什么样的业务,什么样的场景,只要将数据抽象为key-value,理论上都是被open-falcon监控的。举个例子,要监控服务器的qps,那可以将qps数据抽象为{“qps”:1000},前面就是key,后面就是qps的值。然后将数据push到监控中,设置合理的报警即可。其他数据也是一样,所以他是一个非常通用的监控。
上手使用
官方文档已经比较全面了,这里主要讲一下遇到的一些坑
agent上报数据异常
我们有部分机器在运行一段时间以后出现了异常,无法上报数据,异常代码如下:
panic: runtime error: invalid memory address or nil pointer dereference
[signal 0xb code=