用Hadoop处理数据的时候,输出结果总是乱码,这是因为Hadoop在设计编码的时候,默认是UTF-8,当文件编码格式不是为UTF-8的时候,可能输出的时候出现乱码。(感觉就是运气,我舍友第一次运行正常,第二次运行乱码,哈哈哈哈哈哈哈哈哈)
我的mapper类中的value为text
问题解决:
我的文件是GBK格式的,以GBK读入数据,以下代码加到开头,分割用line。
String line = new String(value.getBytes(),0,value.getLength(),"GBK");