切片方法
TextInputFormat(LongWritable,Text)
默认的切片方法
键:存储该行在整个文件的起始字节偏移量。(LongWritable类型)
值:这行的内容,不包括任何终止符(换行符,回车符)。(Text类型)
切片方式:
一次读取一行
一行数据按照分隔符进行切片
切片数量:
一个文件,启用一个MapTask,key是每一个分割块,value是自定义
KeyValueTextInputFormat(Text,Text)
键:每行排在制表符之前的Text序列。(Text类型)
值:分隔符之后的内容。(Text类型)
切片方式:
按照分割符一次读取一行,key是第一个分割块,value是后面所有数据
切片数量:
一个文件,启用一个MapTask