在通过终端查询hive时,终端结果显示为乱码。
这种情况出现的原因是:
1.ssh终端里的编码不是utf-8
如使用scrt,xshell等,都要把编码设成utf-8
2.hive在将数据写入hdfs时候,会把数据格式转换为utf-8格式的。
如果你导入hive表的源数据不是utf-8格式的,hive在进行写hdfs转换格式的时候会出现乱码,所有你查询出来的中文也是乱码。
解决办法:把源文件,用editplus等编辑软件打开,将文件转换为urf-8格式,保存。再重新导入到hive表中,问题解决。源文件只要是文本格式,如csv,txt,log等文本格式,均可用此种方法转化。