Hadoop监控程序

最近一个项目需要收集hadoop作业的执行状态的信息,我给出了以下的解决策略:

1、从Hadoop提供的jobtracker.jsp获取需要的信息,这里遇到的一个问题是里面使用了application作用
JobTracker tracker = (JobTracker) application.getAttribute("job.tracker");
而Jetty服务器是嵌入到Hadoop的内部的
org.apache.mapred.Jobtracker.java
    InetSocketAddress infoSocAddr = NetUtils.createSocketAddr(
        conf.get(JT_HTTP_ADDRESS, "0.0.0.0:50030"));
        infoServer = new HttpServer("job", infoBindAddress, tmpInfoPort,
        tmpInfoPort == 0, conf);
       infoServer.setAttribute("job.tracker", this);

于是,如果想通过jsp页面获取统计信息的,必须绕开Jetty服,或者在修改Jobtracker的中返回infoServer的一个引用,在代码中实现,不过显然这个需要修改Hadoop的核心代码,灵活性不高。


2.此项目已完成,主要通过Hadoop自带的API和仿照Hadoop的部分源码处理过程重新编写数据获取程序,基本可以抓到hadoop自带jetty页面的各种重要数据。

需要的请参照https://github.com/chongyangxue/HadoopMonitor

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值