问题
报错:
ORA-29275: partial multibyte character
这个表是个大表,然后网上一查,基本上定位了故障原因:有中文。转码的问题。
某个表有生僻字、或者整个字符集就不是GBK或者UTF-8等系统默认字符集,然后ORACLE转码失败,就会报错。
大字符集转为小字符集会出现这个问题
解决
不是解决方案的方案
网上的建议1:修改字符集。
……这个基本上不太可行。假如是生产库,给我100个狗胆我也不敢修改系统字符集。
建议2:修改本机字符集。
很明显,这是错的:ORACLE报的错,修改本机字符集干嘛?
解决方案
统一数据库和环境的字符集。统一用utf-8编码。
如果无法修改的话 to_nchar()读取字节流,可以缓解这个问题
问题原因
并不是所有的编码都是utf-8,有的是gbk或者gb2312。
Unicode13.0中收入的汉字大约93000字左右。
GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。共收录汉字和图形符号21886个,其中汉字(包括部首和构件)21003个,图形符号883个。”
基本上可以解决这个问题,谁让unicode字符集大呢。