关于编码
GBK编码是GB2312编码的超集,向下完全兼容GB2312,同时GBK收录了Unicode基本多文种平面中的所有CJK汉字。
GB18030编码向下兼容GBK和GB2312,兼容的含义是不仅字符兼容,而且相同字符的编码也相同。GB18030收录了所有Unicode3.1中的字符,包括中国少数民族字符,GBK不支持的韩文字符等等,也可以说是世界大多民族的文字符号都被收录在内。
UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。
出现的错误
>>> a='䶮'
>>> a
'䶮'
>>> a.encode('gbk')
Traceback (most recent call last):
File "", line 1, in
UnicodeEncodeError: 'gbk' codec can't encode character '\u4dae' in position 0: illegal multibyte sequence
#gb18030
>>> a.encode('gb18030')
b'\xfe\x9f'
>>> b=a.encode('gb18030')
>>> b
#因为utf-8 包含全世界所有国家需要用到的字符,这里在连接时指定编码可以解决这个问题
connection = cx_Oracle.connect("hr", userpwd, "dbhost.example.com/orclpdb1", encoding="UTF-8")