Hadoop和HBase集群的JMX监控

说到对Hadoop和HBase的集群监控,大家知道的和用的最多的可能还是第三方的监控工具,cacti,ganglia,zabbix之类的。玩的深一些的,会用zenoss之类的。这些工具确实不错,也能发挥很大的作用,但时间长了总感觉监控粒度还是比较粗,不够详细。毕竟是第三方的监控,即便Hadoop自带了ganglia的接口,也还是觉得不够。


其实Hadoop本身是带有监控接口的,各公司的发行版还有自己定制的接口,不过可能知道的人就不太多了。这个不详细的看文档和源码一般是找不到的,属于隐藏属性。事实上,我写的EasyHadoop管理界面里面就用到了这个监控的接口,能够对整个集群有一个比较详细的状态监控,目前还在不断扩展。下一步会实现对Java进程的Heap使用的监控,这样对整个集群的性能调优就会起到比较重要作用。


其实这个接口特别简单,但是非常详细,也非常方便,就是JMX。


Hadoop的http监控端口基本所有人都知道,namenode 50070,jobtracker 50030,datanode 50075,tasktracker 50060。不过当用户访问这些端口的时候,会自动跳转到dfshealth.jsp或者jobtracker.jsp这样的监控页面。jmx的访问很简单,只需要把网页的名字换成jmx就可以了。

例如

http://your_namenode:50070/dfshealth.jsp

的地址替换成

http://your_namenode:50070/jmx

即可,其他如50030,50060等等,也依次类推,HBase的系统信息也可以用这种方法获取。


返回值全部是JSON,非常便于自己进行处理。返回的信息也非常详细,内存状态,内存池状态,java堆信息等等。甚至还有操作系统信息,版本,JVM版本信息等等,很全面。


但是这个接口获取的JSON往往很大,而且对于某一项的监控,整个抓一串JSON信息就太浪费了。所以,这又是一个隐藏属性了,只在Hadoop源码中可以了解到。源码在src/core/org/apache/hadoop/jmx中。


JMXJsonServlet.java的一个public类

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
public   void   doGet(HttpServletRequest request, HttpServletResponse response) {
   try   {
     // Do the authorization
     if   (!HttpServer.hasAdministratorAccess(getServletContext(), request,
         response)) {
       return ;
     }
     response.setContentType( "application/json; charset=utf8" );
     PrintWriter writer = response.getWriter();
     JsonFactory jsonFactory =  new   JsonFactory();
     JsonGenerator jg = jsonFactory.createJsonGenerator(writer);
     jg.useDefaultPrettyPrinter();
     jg.writeStartObject();
     if   (mBeanServer ==  null ) {
       jg.writeStringField( "result" "ERROR" );
       jg.writeStringField( "message" "No MBeanServer could be found" );
       jg.close();
       return ;
     }
     String qry = request.getParameter( "qry" );
     if   (qry ==  null ) {
       qry =  "*:*" ;
     }
     listBeans(jg,  new   ObjectName(qry));
     jg.close();
   catch   (IOException e) {
     LOG.error( "Caught an exception while processing JMX request" , e);
     response.setStatus(HttpServletResponse.SC_INTERNAL_SERVER_ERROR);
   catch   (MalformedObjectNameException e) {
     LOG.error( "Caught an exception while processing JMX request" , e);
     response.setStatus(HttpServletResponse.SC_BAD_REQUEST);
   }
}


从源码中可以看到json的获取可以带有http验证,另外还可以有一个参数叫qry。这个参数的值就是在获取整个长JSON中每个"name"key所对应的名字。也就是,可以用

http://your_tasktracker:50060/jmx?qry=GarbageCollector,name=PS MarkSweep

这种方式来获取关于JVM对内存垃圾回收的处理状态信息。很简单不是吗?


在EasyHadoop的Agent中获取HDFS和MR的实时状态监控就是通过JMX的接口,处理代码如下:


1
2
3
4
5
6
7
class   EasyHadoopHandler:
     def   GetJmx( self ,host,port,qry):
         url  =   'http://' + host + ':' + port + '/jmx?qry=' + qry
         jmx  =   urllib.urlopen(url)
         json  =   jmx.read().replace( '\n' ,'')
         jmx.close()
         return   json


由Central主动发起查询JMX的请求,Agent在获取了相关的监控信息后将json返回给Central,Central再用js将数据进行绘图实时返回给用户。


各发行版还有不同的监控接口,例如cloudera版还多加了一个叫metrics也不metrics2的接口。


这样来自己做Hadoop的监控,就比光使用cacti和ganglia就详细了许多。HBase也可对60010等端口进行同样的处理,进行监控。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值