Hadoop学习之MapReduce(三)

49 篇文章 22 订阅 ¥9.90 ¥99.00
19 篇文章 0 订阅
本文详细介绍了Hadoop MapReduce任务的执行过程,包括TaskTracker如何在不同JVM中运行mapper和reducer任务,以及如何通过配置参数如`mapred.map.child.java.opts`和`mapred.reduce.child.java.opts`定制子任务的JVM环境。此外,还探讨了MapReduce的内存管理,包括子任务的最大虚拟内存设置和内存性能调优参数,强调了内存管理对任务性能的影响。最后,讨论了map任务的缓冲区策略和reduce阶段的洗牌与合并过程,以及相关参数对效率的影响。
摘要由CSDN通过智能技术生成

在学习过MapReduce框架的几个关键类和接口后(只是简单的说明了类或者接口的作用及使用方式,要想深入了解如何工作的就需要深入研究源代码了,这也是计划中的学习任务),接下来看看任务的执行和环境,主要涉及的还是一些参数。TaskTracker将mapper/reducer任务作为子进程在不同的jvm中执行,子任务继承了父进程TaskTracker的环境。用户可以通过 mapred.{map|reduce}.child.java.opts配置参数指定额外的选项,比如通过-Djava.library.path=<>指定运行时链接器搜索共享库的非标准的路径。如果mapred.{map|reduce}.child.java.opts参数包含符号@taskid@ ,那么使用MapReduce任务的taskid的值替换@taskid@ 。需要注意的是mapred.{map|reduce}.child.java.opts只用于管理从TaskTracker加载的子任务。

下面是一个包含多个参数和替换的例子,展示了jvm的GC日志,启动了无密码登录的JVM JMX代理(这样可以连接到控制台等以查看子进程内存,线程和取得线程dump),分别设置了map和reduce子jvm的最大堆大小为512MB和1024MB,通过java.library.path为子jvm添加了额外的路径。代码如下:

<property> 
     

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

skyWalker_ONLY

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值