Hadoop Streaming Input and Output

StreamJob.java

run() method:

init();  生成 Environment env_ 对象

prePorcessArgs();

parseArgv(); 解析Hadoop Streaming 命令参数,并赋值给StreamJob成员变量

postProcessArgs(); 检查输入参数的完整性,有效性,充分性

setJobConf(); 根据上面的命令参数,配置mapreduce job 的各项参数

JobConf: jobConf_ : general MapRed job properties

Configuration: config_ : as parameter to create JobConf object.

Class fmt=TextInputFormat.class

TextInputFormat implements InputFormat interface:

public interface InputFormat<K,V>

InputFormat describes the input-specification for a Map-Reduce job.

The Map-Reduce framework relies on the InputFormat of the job to:

  1. Validate the input-specification of the job.
  2. Split-up the input file(s) into logical InputSplits, each of which is then assigned to an individual Mapper.
  3. Provide the RecordReader implementation to be used to glean input records from the logical InputSplit for processing by the Mapper.


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值