大数据之Hadoop(MapReduce):FileInputFormat实现类

1.FileInputFormat的实现类

FileInputFormat常见的接口实现类包括:TextInputformat,KeyValueTextInputFormat,NLineInputFormat,CombineTextInputFormat和自定义的InputFormat等;

2.TextInputFormat

TextInputFormat时默认的FileInputFormat实现类。按行读取每条记录。键是存储该行在整个文件的起始字节偏移量,LongWritable类型。值是这行的内容,不包括任何终止符(换行符和回车符),Text类型。

2.1TextInputFormat实例

在这里插入图片描述

3.KeyValueTextInputFormat

每一行均为一条记录,被分割符分割为key,value.可以通过在驱动类中设置conf.set(KeyValueLineRecordReader.KEY_VALUE_SEPERATTOR,"\t");来设定分隔符。默认分隔符是tab(\t)。

3.1TextInputFormat实例

在这里插入图片描述

4.NLineInputFormat

使用NLineInputFormat,代表每个map进程处理的InputSplit不再按Block块去划分,而是按NLineInputFormat指定的行数来划分,即输入文件的总行数/N=切片数,如果不整除,切片数=商+1。

4.1NLineInputFormat

在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值