目录
在创建数据库时,若指定了不同的字符集,那么存储中文字符所需要的字节数就不同
select length('我'), -- 1 -- hive 默认字符集下
length(encode('我', 'UTF-8')), -- 3
length(encode('我', 'GBK')), -- 2
length(encode('我,a', 'GBK')) -- 4
-- hive 默认字符集下 中文和英文所需要的字节数
select length('w'); -- 1
select length(binary('w')); -- 1
select length('我爱吃鱼'); -- 4
select length(binary('我爱吃鱼')); -- 12