乱码之锟斤拷

gbk——utf8,utf8会把识别不了的字节序列解码为“菱形中一个?”的特殊字符。这个特殊字符转为gbk形式又会变为“锟斤拷”

 

utf-8——gbk,gbk会把不了的字节序列解码为?

 

unicode为字符集

gbk、utf8为编解码方法

 

 

末尾一个问号可能是gbk

 

出现?乱码一般是因为中文字符被iso-8859-1encode,然后被其他字符集decode(?是%3F)

例如:和蔼——%3F%3F——??

 

出现ær这种特殊乱码可能是因为中文字符先被utf8encode,后被iso-8859-1decode

转载于:https://my.oschina.net/u/2499008/blog/1634916

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
关于Hive中的乱码问题的解决方案,可以参考以下步骤: 1. 首先,确认Hive使用的底层数据库是MySQL。因为Hive默认使用Derby作为元数据存储,而Derby不支持修改编码方式。 2. 接下来,需要修改MySQL的编码设置为UTF-8。可以通过以下步骤进行修改: a. 如果是离线安装的MySQL,可以通过修改my.cnf文件来设置编码。在my.cnf文件中,找到[mysqld]配置段,添加以下两行: character-set-server=utf8 collation-server=utf8_general_ci b. 如果是在线安装的MySQL,可以通过以下命令修改编码: ALTER DATABASE database_name CHARACTER SET utf8 COLLATE utf8_general_ci; ALTER TABLE table_name CONVERT TO CHARACTER SET utf8 COLLATE utf8_general_ci; 3. 确保Hive的配置中指定了正确的MySQL连接参数。在Hive的hive-site.xml文件中,设置以下参数: hive.metastore.uris - 指定MySQL的连接地址 javax.jdo.option.ConnectionURL - 指定MySQL的连接URL javax.jdo.option.ConnectionUserName - 指定MySQL的用户名 javax.jdo.option.ConnectionPassword - 指定MySQL的密码 通过以上步骤,可以解决Hive中的乱码问题,并确保数据以UTF-8编码存储。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [hive中解决中文乱码](https://blog.csdn.net/zmzdmx/article/details/113778839)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值