Python乱码、编码
三种编码之间可以通过unicode进行转化,内部默认存储为unicode格式
unicode为中介
一般使用uft-8
gbk一般显示为乱码
str.decode('utf-8').encode('gbk')
str.decode('gbk').encode('utf-8')
unicode可以显示在hive表中
str.decode('utf-8')得到unicode格式的字符串
参考文献:
https://blog.csdn.net/chixujohnny/article/details/51782826