mapreduce 输出乱码

Hadoop处理GBK文本时,发现输出出现了乱码,原来HADOOP在涉及编码时都是写死的UTF-8,如果文件编码格式是其它类型(如GBK),则会出现乱码。 此时只需在mapper或reducer程序中读取Text时,使用transformTextToUTF8(text, "GB...

2017-04-07 14:58:43

阅读数 2234

评论数 2

mapreduce 自定义key/value 输出分隔符 (mapreduce输出结果key和value有空格怎么办?)

mapreduce 默认情况下 key/value 分隔符为:“\t” 测试的输出如下: 我们可以在代码中进行设置来自定义 key/value 输出分隔符:在代码中添加如下一行代码: conf.set("mapred.textoutputformat.separ...

2017-04-06 11:26:07

阅读数 341

评论数 0

提示
确定要删除当前文章?
取消 删除