oracle取出生僻字显示乱码,python cx_Oracle 查询到生僻字报错问题处理

该博客详细介绍了GBK、GB18030和UTF-8编码之间的关系与区别。GBK是GB2312的超集,兼容GB2312,而GB18030在兼容GBK的同时,包含了更多Unicode字符,如少数民族文字和韩文。UTF-8则是一种国际编码,支持全球所有国家的字符。文中通过Python示例展示了编码与解码过程中可能出现的问题,并强调了在处理不同编码时的注意事项。
摘要由CSDN通过智能技术生成

关于编码

GBK编码是GB2312编码的超集,向下完全兼容GB2312,同时GBK收录了Unicode基本多文种平面中的所有CJK汉字。

GB18030编码向下兼容GBK和GB2312,兼容的含义是不仅字符兼容,而且相同字符的编码也相同。GB18030收录了所有Unicode3.1中的字符,包括中国少数民族字符,GBK不支持的韩文字符等等,也可以说是世界大多民族的文字符号都被收录在内。

UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。

出现的错误

>>> a='䶮'

>>> a

'䶮'

>>> a.encode('gbk')

Traceback (most recent call last):

File "", line 1, in

UnicodeEncodeError: 'gbk' codec can't encode character '\u4dae' in position 0: illegal multibyte sequence

#gb18030

>>> a.encode('gb18030')

b'\xfe\x9f'

>>> b=a.encode('gb18030')

>>> b

#因为utf-8 包含全世界所有国家需要用到的字符,这里在连接时指定编码可以解决这个问题

connection = cx_Oracle.connect("hr", userpwd, "dbhost.example.com/orclpdb1", encoding="UTF-8")

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值