现象:
查询表信息,中文注释为乱码;
问题:
Hive中的注释都是作为元数据存储在MySQL中,MySQL中默认的字符集为lantin1,不支持中文
解决:
在MySQL数据库中,修改hive元数据(列字符编码)为utf-8
alter table hive.COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
alter table hive.TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
alter table hive.PARTITION_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8 ;
alter table hive.PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;
alter table hive.INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
验证:
1.删除掉原来的测试表
drop table if exists ods_test ;
2.重新创建测试表
create table ods_test(
oid string comment '订单id',
pid string comment '商品id',
uid string comment '用户id'
) comment '订单测试表' ;
3.查看表信息即可
show create table ods_test;
即修改完成!!!!