ORACLE字符集问题

这几天在接手了一个项目,客户提供了一个DMP文件与所需的表空间创建文件。按照IMP习惯,先创建了实例与表空间,再进行IMP FULL导入,执行时报出了字符集不一致的问题。同事在网上查了资料,发现更改这个DMP十六进制文件中的部分字符,可以实现正常导入。这个更改的原理是,将导入文件的字符集修改为ZHS16GBK,与服务端一致。

这个修改引起了我的思考,由于我们这个项目需要与客户原有的数据库进行通信,如果字符集不一致的话,是否会导致乱码问题的出现?我与客户的DBA进行了沟通,他说会引发乱码的出现。于是我想,我们不得不与客户的数据库字符集一致。根据我所学的知识,我深刻地记得THOMAS KYTE说过:“数据库的字符集更改,如果从子集向超集更改,不会导致数据丢失。但反过来则不行”,原话不是这样的,不过意思一致,呵呵,记不清楚了。正好,客户那边使用的是US7ASCII字符集,而我们这边安装的是ZHS16GBK。GBK是ASCII的超集,这个转换是子集到超集的转换,当然能成功,且不会导致数据丢失。而到时候我们项目交付的时候,需要的是与客户数据库一致的US7ASCII。当然这种逆向的超集到子集的转换是不能成功的,出现的结果就是数据乱码与数据丢失。于是,我们使用库的字符集也必须是US7ASCII,于是进行了研究。

刚开始时,向客户询问了主字符集与国家字符集,客户提供说都是US7ASCII,于是我将数据库字符集进行了设置。可是导入的时候还是报出字符集不一致的异常。在网上查了些相关的资料,发现不仅是服务端字符集需要一致,且客户端字符集也必须一致,此时设置了客户端字符集:SET NLS_LANG=AMERICAN_AMERICA.US7ASCII

OK了,字符集问题解决。字符集相关知识,提供给大家参考,提醒大家重视这个简单的问题。

 

1.字符集相关知识、如何查看字符集

Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储,处理,检索数据。它使数据库工具,错误消息,排序次序,日期,时间,货币,数字,和日历自动适应本地化语言和平台。

如何查询Oracle的字符集ORACLE有三方面的字符集,

一  是oracel server端的字符集,二是oracle client端的字符集;三是dmp文件的字符集。在做数据导入的时候,需要这三个字符集都一致才能正确导入。

查看oracel server端的字符集select userenv('language') from dual;

查看dmp文件的字符集用oracle的exp工具导出的dmp文件也包含了字符集信息,dmp文件的第2和第3个字节记录了dmp文件的字符集。如果dmp文件不大,比如只有几M或几十M,可以用UltraEdit打开(16进制方式),看第2第3个字节的内容,如0354,然后用以下SQL查出它对应的字符集:select nls_charset_name(to_number('0354','xxxx')) from dual

--查看oracel client端的字符集 是注册表里面相应OracleHome的NLS_LANG。(检查客户端注册表,打开注册表编辑程序(RegEdit),在HKEY_LOCAL_MACHINE/SOFTWARE/ORACLE/NLS_LANG)还可以在dos窗口里面自己设置,比如: set nls_lang=AMERICAN_AMERICA.ZHS16GBK 这样就只影响这个窗口里面的环境变

查看所有参数:

select * from V$NLS_PARAMETERS;

其中,字符集的关键词是:NLS_CHARACTERSET

其他参数:

    language 指定服务器消息的语言。

territory 指定服务器的日期和数字格式。

NLS_CHARACTERSET 指定字符集

还有一些子集可以更明确定义NLS_LANG参数:

NLS_DATE_FORMAT 缺省的日期格式

NLS_DATE_LANGUAGE 缺省的日期语言

NLS_NUMBERIC_CHARACTERS 小数字符和组分隔开

NLS_CURRENCY 本地货币字符

NLS_ISO_CURRENCY ISO货币字符

NLS_SORT 字符排序序列

指定查看关键词:

select value$ from props$ where name='NLS_CHARACTERSET'

有3个参数需要特别注意:有三个参数需要特别注意:

NLS_LANGUAGE   NLS_TERRITORY   NLS_CHARACTERSET

                                          2 如何修改字符集

一、更改客户端字符集为US7ASCII

                D:\>SET NLS_LANG=AMERICAN_AMERICA.US7ASCII

    更改客户端字符集为ZHS16GBK

                D:\>SET NLS_LANG=AMERICAN_AMERICA.ZHS16GBK

二、更改服务器字符集为ZHS16GBK (实践成功)

                SQL> update props$ set value$='ZHS16GBK' WHERE NAME='nls_language';

alter  system set nls_language=ZHS16GBK

很多情况下,单纯地去更改服务端的字符集,也无法解决问题,还可能造成大错!

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/13636837/viewspace-627437/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/13636837/viewspace-627437/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值