Hadoop中常用的InputFormat,OutPutFormat类

Hadoop常用的INPUTFORMAT类,下表中列出来InputFormat的其他常用实现,并简要描述了每个实现传递给mapper的键/值对.

 

 

TestInputFormat

在文本文件中的每一行均为一个记录.键(key)为一行的字符偏移,而值(value)为一行的内容

Key:LongWritable

Value:Text

KeyValueTextinputFormat

在文本文件中的每一行均为一个记录.以每行的第一个分隔符为界,分隔符之前的是键(key),之后的是值(value).分离器在属性key.value.separator.in.input.line中设定,默认为制表符(\t)

Key:Text

Value:Text

SequenceFileInputFormat<K,V>

用于读取序列文件的InputFormat,键和值由用户定义,序列文件为Hadoop专用的压缩二进制文件格式.它专用于一个MapReduce作业和其他MapReduce作业之间传送数据

Key:K(用户定义)

Value:V(用户定义)

NLineInputFormat

与 TestInputFormat相同,但每个分片一定有N行,

N在属性mapred.line.input.format.inespermap中设定,默认为1.

Key:LongWritable

Value:Text

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

TextOutputFormat将每个记录写为一行文本,键和值以字符串的形式写入.并以制表符(\t)分隔,这个分隔符可以在属性mapred.textoutputformat.separator中修改.
SequenceFileOutputFormat<K,V>以hadoop专有序列文件格式写入键/值对.与SequenceFileInputFormat配合使用
nullOutputFormat<K,V>无输出

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值