Hadoop2.0:Jvisualvm监控MapReduce和spark作业

本文介绍了如何利用jvisualvm监控在Hadoop2.0 YARN上运行的MapReduce和Spark作业。通过在配置文件中添加特定参数,并在jvisualvm中添加JMX连接,可以实现对作业执行过程的直观监控。这种方法适用于长时间运行的数据处理任务,但对于短时间内完成的作业可能不适用。
摘要由CSDN通过智能技术生成

注意: 这个监控适用于执行时间长的作业,比如数据量较大的mapreduce和spark,以及spark streaming等。对几秒到几分钟的作业,恐怕你还没配置好jvisualvm监控,作业就结束了。

昨天看了一篇介绍如何用jvisualvm监控spark作业的方法,因为我的MapReduce作业和spark作业都是跑在hadoop2.0的yarn上的,所以自己探索者把mapreduce和spark on yarn都配置了jvisualvm监控。监控效果很赞,很直观,相信很多同学会用到的。

jvisualvm是java自带的小组件,在昨天之前我都不知道它的存在。在javaPath/jdk/bin/下面。在Linux下怎么用它我还没试,在windows下直接双击jvisualvm.exe打开就好。



spark on yarn配置


1.  客户端的spark-default.conf中添加一行配置:

spark.driver.extraJavaOptions   -Dcom.sun.management.jmxremote.port=1099 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false


2. 启动spark作业


3. 打开jvisualvm,点“文件”--“添加jmx连接”,输入driver所在host:port。这里的port就是1里面配置的1099。注意,防止端口冲突。



MapReduce on yarn


1. 客户端的mapred-site.xml中修改配置项“yarn.app.mapreduce.am.command-opts”,在末尾添加:

”-Dcom.sun.management.jmxremote.port=1099 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false


2. 启动MapReduce作业

3. 打开jvisualvm,点“文件”--“添加jmx连接”,输入AM所在host:port。


监控界面类似如下:




++ 

还可以用同样的方法配置jvisualvm监控rm,监控namenode等,都很容易配置。因为rm, nn其实都是运行在jvm里的,所以jvisualvm监控都是ok的。具体的配置方法和上面的一样,就不详细说明了。

考虑了下,貌似不可以用jvisualvm监控hadoop1.0中的MapReduce作业,因为1.0中没有AM的概念,与AM类似的操作时在jobtracker中执行的,所以无法做到以作业为单位的监控。



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值