Hi ~ 小老弟开始转公众号啦,欢迎大家来指点迷津呀
就一般情况来说,Oracle存储中英文的字段用varchar2类型就可以了,但有些时候,遇到生僻字就不行了。
需求描述: 在默认字符集环境下,实现Oracle储存生僻字: 㛃、䶮.....(使用nvarchar2字段类型实现,以“㛃”为代表进行测试)
1.查看当前使用的字符集 。
select userenv('language') from dual;
一般来说,在安装Oracle数据库的时候,字符集设置选择的是使用默认值,也就是 ZHS16GBK
2.建立测试表。
varchar2 跟 nvarchar2 区别不大,但是在存放中文的时候,nvarchar2会比varchar2多一点。
3.插入测试数据。
显而易见,这两种类型都行不通了。然而,我们可以换一下插入方法
首先,把生僻字转换为Unicode。链接http://www.bejson.com/convert/unicode_chinese/
"㛃" 转为Unicode为 "\u36c3"(注意: \u 是Unicode的转义字符,使用的时候要去掉)
然后,从dual中查询结果:
select utl_raw.cast_to_varchar2('36c3') from dual;
select utl_raw.cast_to_nvarchar2('36c3') from dual;
可见,实质上,在nvarchar2才存储了“㛃”字
最后,再一次进行插入数据:
nvarchar2类型的TNAME成功插入了生僻字“㛃”。
4.最后一点。
虽然说这个问题一般在很小的项目下不会经常遇到,但是还是有它存在的意义的。说不定哪一天你录入数据的时候,姓名会带有生僻字,然后惊奇发现数据变成 ? 了,然后,百度谷歌一找,各有各的说法,各有各的方案,然而...实用的?凉凉。作为过来人我觉得我有必要总结一下这个干货吧,希望能帮到有需要的人,欢迎转载,记得带上原文链接就好。
至于有人说通过更改数据库的字符集也可以实现,可以啊,但是这个代价和工作量过分点了吧?万一出现什么差池,后果太美不敢想象。除非在立项初期,考虑十分周到,囊括所有编码的问题,但是,这个,也有点玄。