Hadoop学习之MapReduce(四)

49 篇文章 22 订阅 ¥9.90 ¥99.00
19 篇文章 0 订阅
本文详细介绍了MapReduce的目录结构,包括hadoop.tmp.dir和mapred.local.dir参数,以及TaskTracker的本地目录结构,如jobcache、distcache、job.xml等文件的位置。此外,还讨论了JVM重用、DistributedCache的使用,以及任务的标准输出和错误输出的存储位置。最后提到了作业提交、监控和输入输出相关内容。
摘要由CSDN通过智能技术生成

接下来是跟MapReduce目录结构有关的参数。首先看两个参数,分别为在core-default.xml中定义的hadoop.tmp.dir,其默认值为/tmp/hadoop-${user.name},另一个为定义在mapred-default.xml中的mapred.local.dir,该参数指定了保存MapReduce中间数据文件的目录,其默认值为${hadoop.tmp.dir}/mapred/local。在下面的学习中将会直接引用mapred.local.dir。TaskTracker拥有本地目录,目录${mapred.local.dir}/taskTracker/用于创建本地缓存和本地作业。可以定义多个本地目录(分布在多个硬盘上)并且每个文件名被半随机地分配到本地目录中。当作业启动时,TaskTracker创建与本地目录(该目录由配置参数指定)相关的本地作业目录。这样,TaskTracker目录结构就像下面描述的:

  1. ${mapred.local.dir}/taskTracker/distcache/:所有用户的作业的公有分布式缓存。该目录保存本地的公有分布式缓存,这样本地的公有分布式缓存就可以在所有用户的所有任务和作业之间共享。
  2.  ${mapred.local.dir}/taskTracker/$user/distcache/ :特定用户的作业的私有分
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

skyWalker_ONLY

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值