问题描述:
在刚开始学Hive时,遇到这样的问题,在Datagrip中建表加注释
但desc dwt_visitor_topic查看表后发现注释部分(comment)出现乱码,如图所示:
解决:
Hive元数据库的字符集默认为Latin1,由于其不支持中文字符,故若建表语句中包含中文注释,会出现乱码现象。如需解决乱码问题,须做以下修改
1)修改Hive元数据库中存储注释的字段的字符集为utf-8
登录mysql,输入用户密码
mysql -uroot -p123456
切换元数据库
use metastore;
设置字段注释
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
设置表注释
alter table TABLE_PARAMS modify column PARAM_VALUE mediumtext character set utf8;
退出mysql
exit;
重启MySQL服务
sudo systemctl restart mysqld
2)修改hive-site.xml中JDBC URL,如下
<!-- jdbc 连接的 URL -->
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://hadoop102:3306/metastoreuseSSL=false&useUnicode=true&characterEncoding=UTF-8</value>
</property>
现在启动Hive服务后再创建表显示就一切正常了,创建个表测试效果如下:
注意:在修改之前创建的仍然乱码没有办法,只有在修改后创建的表显示才不会乱码