问题描述:在我们将文件导入到hive时候,hive表中出现了乱码的问题。
解决思路:
1.读的时候,是不是乱码问题,这个排除。因为当地保存的就不是乱码。
2.那么有没有是写得时候的编写问题,因为一开始用的是Filewriter,这个的话,默认的是写出的ASCER码值。所以传入到hive中有乱码,在生成数据的代码中修改成
BufferedWriter out=new BufferedWriter(new OutputStreamWriter(new FileOutputStream(outfile),"GBK"));
这样的话,写出来的就是GBK格式的。这样在导入到 hive中,就是中文。
3.可能是hive读取的问题。那么就要设置一些hive中的设置问题。