客户端写入中文,服务端存储中文,客户端查询中文,所以客户端对中文进行编码时,不能乱:
(1)必须使用可以支持中文编码的字符集:url参数后面添加
useUnicode=true&characterEncoding=UTF-8
(2)服务端收到中文后,必须用中文存,设置表的字符集:
#修改字段注释字符集
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
#修改表注释字符集
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(20000) character set utf8;
#修改分区参数,支持分区建用中文表示
alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(20000) character set utf8;
alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(20000) character set utf8;
#修改索引名注释,支持中文表示
alter table INDEX_PARAMS modify column PARAM_VALUE varchar(4000) char

本文介绍了在Hive on Spark中解决中文乱码问题的方法,包括客户端写入、服务端存储和查询时的注意事项。关键步骤包括在URL参数中指定UTF-8编码,以及通过SQL命令修改Hive表、分区、索引和视图的字符集为UTF-8。
最低0.47元/天 解锁文章
5909

被折叠的 条评论
为什么被折叠?



