Hadoop在用流输出文件时出现中文乱码情况

最新推荐文章于 2022-08-02 22:59:58 发布

weixin_57597001

最新推荐文章于 2022-08-02 22:59:58 发布

阅读量844

点赞数

文章标签： mapreduce hdfs 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_57597001/article/details/119393605

版权

idea默认的编码是UTF-8，所以在输入的文件编码不是UTF-8时，就有可能会出现乱码的情况。

方法一：
在map或者reduce阶段在封装前将Text修改一下

String s = new String(value.getBytes(),0,value.getLength(),"GBK");

方法二：

在写出流的方法public void write(Text text, IntWritable intWritable) throws IOException, InterruptedException 中将String s = text.toString();改成

String s = new String(text.getBytes(),0,text.getLength(),"UTF-8");

方法三：chongfudata.writeBytes(s+"\n");

改成chongfudata.write(s.getBytes());写出输出到文件中

weixin_57597001

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Hadoop在用流输出文件时出现中文乱码情况

idea默认的编码是UTF-8，所以在输入的文件编码不是UTF-8时，就有可能会出现乱码的情况。方法一：在map或者reduce阶段在封装前将Text修改一下String s = new String(value.getBytes(),0,value.getLength(),"GBK");方法二：在写出流的方法public void write(Text text, IntWritable intWritable) throws IOException, InterruptedExcep
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。