需要注意的点:
1. 导出文件的字符集
hive中的数据字符集只有utf8,如果导出的文件为GBK,在serde不做特殊处理时,临时表中会存在乱码的情况。
3种方案:
1.导出文件时,做转码。 注:如db2 指定codepage,需注意一点:数据库字段约束长度问题,GBK
需要注意的点:
1. 导出文件的字符集
hive中的数据字符集只有utf8,如果导出的文件为GBK,在serde不做特殊处理时,临时表中会存在乱码的情况。
3种方案:
1.导出文件时,做转码。 注:如db2 指定codepage,需注意一点:数据库字段约束长度问题,GBK