数据库字符集为西文WE8ISO8859P1,但是WE8ISO8859P1字符集并没有存储中文的编码,如果我的客户端字符集为ZHS16GBK,以GBK来编码汉字,这个时候,我客户端进行INSERT INTO T1 VALUES(1,'中国');COMMIT;那么我在客户端查看SELECT ID,NAME FROM T1看到的结果集一定是??这样的乱码。[@more@]因为,客户端字符集为ZHS16GBK,而数据库字符集为西文WE8ISO8859P1,既然客户端与数据库端的字符集不一样,那么,数据库端必然要进行转码处理,从客户端传送到数据库端的是“中国”的编码: d6,d0,b9,fa。当编码 d6,d0,b9,fa传送到数据库服务器端的时候,因为oracle并不知道客户端传送过来的编码是以什么字符集来进行编码的,oracle就会查询客户端的参数NLS_LANG的值是什么,
如果该值是ZHS16GBK:那么oracle就去数据库查找相应的字符集(oracle数据库里保持了大量的字符集,包括有ZHS16GBK,视图 v$nls_valid_values可以查看),找到了ZHS16GBK字符集,那么这个时候,oracle就把传送过来的编码d6,d0,b9,fa转成汉字“中国”(这就完成了转码处理)。再把“中国”,用WE8ISO8859P1字符集进行编码处理,保存在数据库里面,但是,不幸的是,WE8ISO8859P1字符集并没有存储中文的编码,所以,“中国”这两个汉字就以乱码形式(??)保存在数据库里。当客户端读取的时候,就呈现为乱码,这就是乱码的来源了;
如果该值为WE8ISO8859P1:那么就欺骗了数据库,因为oracle发现客户端字符集与数据库端字符集一致,不需要进行转码处理,直接把d6,d0,b9,fa编码保存在数据库里,客户端读取的时候,当然是汉字“中国”了,就不存在乱码的事件。我现在管理的数据库字符集就是西文字符集WE8ISO8859PI,客户端参数NLS_LANG必须设置为WE8ISO8859PI,不然读取会是乱码。其实这样有一个问题,欺骗数据库的方式存储汉字编码,这样会不会有问题,有待进一步分析。
在我看来,数据库如果是中文环境,最好设置为ZHS16GBK字符集,如果是多语言环境,最好设置为AL32UTF8,并将客户端参数NLS_LANG设置成与客户端操作系统字符集一致,即时客户端字符集与服务器端字符集不一致,也能进行正确的编码转换处理,那么就不会发生乱码这样的事情了。
在我看来,数据库如果是中文环境,最好设置为ZHS16GBK字符集,如果是多语言环境,最好设置为AL32UTF8,并将客户端参数NLS_LANG设置成与客户端操作系统字符集一致,即时客户端字符集与服务器端字符集不一致,也能进行正确的编码转换处理,那么就不会发生乱码这样的事情了。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/28227905/viewspace-1059790/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/28227905/viewspace-1059790/