1.问题描述
默认Hive中创建有中文注释的表时,无论是在Hive CLI还是Hue中该注释显示都会是乱码。如使用以下建表语句:
create external table test_table
(
s1 string comment 'abc',
s2 string comment '你好啊'
)
row format delimited fields terminated by '#'
stored as textfile location '/lilei/test_table';
在Hive CLI中查看如下:
Hue中显示一样,这里省略。
2.解决办法
这个问题是因为mysql中的元数据库表COLUMNS_V2中的字段COMMENT编码问题导致的,需要设置为utf-8,如下所示:
在mysql中设置该字段的编码为utf-8,如下所示:
mysql –u root –p
use metastore;
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;FLUSH PRIVILEGES;
注意Hive元数据这个数据库应使用utf-8创建,如:create database metastore defaultcharacter set utf8;
回到Hive中重现create一张表
查看该表的注释:
发现中文注释已经显示正常。
查看以前的表:
发现依旧显示为乱码。
需要修改以前的表的comment才能显示正常,在Hive CLI中执行,命令如下:
ALTER TABLE test_table1 change column s2 s2 STRING COMMENT '我不好';
再次查看旧表的comment:
发现中文注释已经显示正常。问题解决。