笔记:Hadoop权威指南 第5章 MapReduce 应用程序开发


一、代码结构

新接口的代码结构:


启动作业的命令:

hadoop jar   myjob.jar   com.test.MaxTemperature  -conf   conf/tempConf,xml      in/ncdn/1990   out/ncnd/1990


获取输出命令:

hadoop fs -getmerge  outDir     localFile

cat  localFile


二、Job、Task、TastAttempt 命名规范 

job_201412110823_002  :  job_运行时间_第几个JOb

task_201412110823_002_m_000003 / task_201412110823_002_r_000003:   task_JobId_map还是reduce_第几个task

attemp_201412110823_002_m_000003_0 : attempt_taskId_第几次尝试


三、作业状态

Pending、Running、Completed、Killed


四、作业调优

1、Mapper 数量:

2、Reducer数量:

3、使用Combiner

4、Mapper 的输出压缩:

5、自定义Writable 或Comparator 要实现 RawComparator

6、调整Shuffle



五、MapReduce 工作流

使用ChainMapper、ChainReducer






  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值