有了hadoop集群后,对集群的作业指标进行统计,很多时候只能凭借jobtracker的日志界面进行查看。但日志界面没有历史趋势等统计功能。给
数据平台的管理计费,和作业情况,会造成很大的困扰。特别是历史作业趋势和实时作业运行情况,对于拥有大数据计算集群的公司来说,非常
重要。为解决这个问题,我们结合本公司内部的数据集群使用,采用python+flume+pig+mysql+php对集群情况做了一套监控集群运行的系统。
暂名HadoopEye。
这套系统主要模块是历史趋势(采用python+flume+pig+mysql)和实时情况(kafka+spark)。
现在已经开发出来历史趋势部分,下面特将功能截图如下。
host分时
MapReduce各个host情况
根据任务队列的分析
各个点的故障趋势,点击指标会出现该点的历史趋势
上面是历史趋势的功能。可以做到对集群运行情况有个直观的了解,了解集群运行大概情况,和故障情况。