最近在做spark的监控,spark原生支持jmx的方式来获取运行的metric,因此采用了zabbix的java gateway做监控。

因为之前也涉及过java应用的监控,这里做小小结:
对于java应用一般会关注3大块的信息:heap,gc,thread.
旧版本的zabbix没有java gateway这个概念,只能通过自己写脚本来获取监控信息:
1)通过jstat这种工具来获取监控信息
2)cmd jmx的方式,具体实现是应用打开jmx端口
让后在cmd的方式下调用相关的jar包来获取信息
比如下面这个获取thread的信息:
java  -jar cmdline-jmxclient-0.10.3.jar - 127.0.0.1:8060 java.lang:type=Threading ThreadCount
05/16/2013 10:32:10 +0800 org.archive.jmx.Client ThreadCount: 84
3)新版本的zabbix支持java gateway,可以通过jmx端口直接获取java的相关信息
(关于java gateway请参考zabbix官方文档)
这里有两个细节:
1)远程调用jmx的话,需要使用:
-Djava.rmi.server.hostname=xxxx
因此常用的打开jmx的参数为:
-Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.authenticate=false
-Dcom.sun.management.jmxremote.port=8060 -Dcom.sun.management.jmxremote.ssl=false
-Djava.rmi.server.hostname=服务器ip
2)一台机器上运行多个java的监控方法
因为jmx的item中没有port这个参数,在添加多个jmx时,会有冲突错误。

workaround的方法就是新建item的时候在item中增加空格,这样就会识别成不同的item并且对值没有影响。

3)对java gateway做交叉监控,防止java gateway进程出错的情况。