来源:《Hadoop权威指南(第2版)》
单纯摘抄
1. 文本输出
TextOutputFormat为默认的输出格式,把每条记录写为文本行。
TextOutputFormat输出的键/值分割符可由mapred.textoutputformat.separator属性设置,默认为制表符。
2. 二进制输出
- SequenceFileOutputFormat
SequenceFileOutputFormat将输出写为一个顺序文件。 - SequenceFileAsBinaryOutputFormat
SequenceFileAsBinaryOutputFormat把键/值对作为二进制格式写入到SequenceFile容器中。 - MapFileOutputFormat
MapFileOutputFormat 把MapFile作为输出,键必须按顺序添加。
3. 多个输出
- MultipleOutputFormat
MultipleOutputFormat类可以将数据写到多个文件,文件的名称源于输出的键和值。
MultipleOutputFormat的实体子类:MultipleTextOutputFormat、MultipleSequenceFileOutputFormat。 - MultiPleOutputs
MultipleOutputFormat不同的输出产生不同的类型。