此处用的数据库类型为mysql。发现hive在初始化创建这些表的时候,大部分字段的字符集给设置成了latin1,然后collation设成了latin1_bin。
但是我们在hive中创建表时,表注释和字段注释通常会包含中文。这样我们就需要修改一下mysql中表的一些字段的字符集和collation。
表注释对应的字段为:TABLE_PARAMS.PARAM_VALUE
字段注释对应的字段为:COLUMNS_V2.COMMENT
只要将这两个字段的 character设为utf8mb4,collation设为 utf8mb4_unicode_ci 即可。
以上。