转载请注明来自本空间:
本文基于Hadoop 0.20.XX版本分析,和现在的Metrics2稍有不同
1:概述
Hadoop Metrics用来统计集群运行数据,比如接口调用次数,响应时间,队列长度等等,现阶段(0.19版本)支持为数不多的几个层级的数据,分别是dfs,jvm,rpc,mepred等。这些数据收集之后可以sink(通过context)到不同的目的地,比如文件,ganglia,等,也可以自己实现一个context去sink这些数据到你指定的地方。
2:架构

本文深入剖析了Hadoop Metrics体系架构,详细介绍了MetricsUtil如何启动监控,ContextFactory如何根据配置文件创建Context,并通过Updater和Record进行数据更新与发送。Metrics的类型包括时间累积、时间值和时间率,数据通过context的定时任务进行更新和sink操作。
最低0.47元/天 解锁文章
1042

被折叠的 条评论
为什么被折叠?



