字符集问题

部分内容来自:https://blog.csdn.net/haiross/article/details/18225415
在日常工作中,我在进行导入导出的时候,出现了这样一个问题,经过翻阅资料,找到了原因
我的数据库版本是Oracle 10g的
错误如下
在这里插入图片描述

export file created by export:v10.02.01 via conventional path
import done inus7ascll characterset and al16utf16 nchar character set
import server uses zhs16gbx character set possible charset conversion
export client uses zhs16gbx character set possible charset conversion
import terminated successfully without warnings

意思大概是
导出文件由export创建:v10.02.01通过常规路径
导入完成inus7ascll字符集和al16utf16 nchar字符集
导入服务器使用zhs16gbx字符集可能进行字符集转换
导出客户端使用zhs16gbx字符集可能进行字符集转换
导入在没有警告的情况下成功终止
应该是字符集的问题
我查看了导入时的日志:
在这里插入图片描述
我在使用
select userenv('language') from dual; 查看了原服务器和新服务器数据库的字符集
字符集都是ZHS16GBK的
后来查看资料发现不是服务端字符集的问题,而是客户端字符集的问题,
我在注册表里面
HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE\KEY_OraDb11g_home1
NLS_LANG配置文件中把字符集改成了ZHS16GBK
恢复正常
后来,我总结了一下字符集的问题:总结如下
在这里插入图片描述
如图,为了说明问题,我们将服务器与客户端分开,客户端用应用程序比如sqlplus或者PL/SQL与服务端相连。

服务端有两个字符集:服务端操作系统字符集(4)、服务端数据库字符集(1);

客户端有一个字符集:客户端操作系统字符集(2);

客户端有一个参数:操作系统参数NLS_LANG(3)。

这三个字符集与一个参数中,有一个字符集对整个架构的运行没有影响,它就是服务端操作系统字符集(4),所以这个字符集将不再出现在我们的讨论过程中。

为什么这个服务端操作系统字符集没有用呢?这是因为Oracle在存取字符时与客户端进行字符集确认与转码的过程是由Oracle数据库自身完成的,不需要经过Oracle数据库所在的服务器的帮助。具体的是怎么回事用以下例子说明一下。

比如在Oracle数据库中有一个表,用如下语句创建:

create table test(name varchar2(10));

为了说明问题假定有这样的一个环境:服务器端Oracle数据库的字符集是UTF8,客户端操作系统字符集是ZHS16GBK,客户端NLS_LANG参数设置为ZHS16GBK。

那么从客户端应用程序(比如sqlplus)发出这样一条命令:
insert into test (name) values(‘中国’);
首先,这里有一个字符串“中国”,客户端操作系统用ZHS16GBK对它进行编码,比如编成“167219”,并把它交给sqlplus程序,然后把它发送给Oracle数据库。接着,Oracle数据库收到一串编码“167219”,不是直接往数据库里一扔就完事的,它要问客户端操作系统:“请问你给我的这串代码是用什么格式编码的啊?”客户端操作系统怎么回答?它会这么回答:“编码格式请参照参数NLS_LANG”。Oracle数据库一看,NLS_LANG=‘ZHS16GBK’,这个编码格式与Oracle数据库自身的编码格式“UTF8”不一样,然后就是Oracle数据库发挥自己专长的地方了,为什么呢?因为Oracle数据库有它自己的编码表,而且不是一张而是好多张编码表,它可以根据编码表对编码进行翻译和转码。这就好比Oracle数据库是一个翻译,它会好几国语言,牛人一个。像上面的这个情况,Oracle会把“167219”这串代码拿过来,根据参数NLS_LANG查ZHS16GBK编码表,找到对应这串代码的字符“中国”,然后再到UTF8编码表中查“中国”对应的编码,比如查到的结果是“3224678”。
最后,将转码之后的编码“3224678”存放到Oracle数据库中去。

为了进一步说明问题,我们再执行一条语句:

select name from test;

首先,Oracle数据库会从数据库中取出一串代码“3224678”。

接着,Oracle数据库不是直接把这串代码交给sqlplus程序,它会多问一句:“代码串我是取出来了,它是UTF8编码格式的,请问sqlplus,你希望要什么编码格式的?”,sqlplus仍然会很爽快地告诉Oracle数据库:“编码格式请继续参照参数NLS_LANG”。Oracle数据库一看,ZHS16GBK跟UTF8又不一样,所以先查UTF8编码表,找到编码“3224678”对应的字符“中国”,再查ZHS16GBK编码表,找到“中国”对应的编码“167219”,然后就是把最后得到的这串编码“167219”交给sqlplus程序。

最后,sqlplus直接把得到的这串编码扔给客户端操作系统,而操作系统只有ZHS16GBK编码表,它不会问得到的这串编码是什么格式的,只会直接到ZHS16GBK编码表中去查“167219”对应的字符是什么,并把它交给应用程序显示出来。这个显示的结果是“中国”。

以上就是一个完整的从客户端编码并经过Oracle数据库转码存入数据库,然后从数据库取出并转码交给客户端显示的实验。

总结如下:
1、Oracle数据库如何选择字符集?只有一个原则,那就是这个字符集要包含数据库运行过程中所能存入的数据字符,通常作为中国人我们选择ZHS16GBK,如果想再保险一点,选择AL32UTF8。

2、服务器操作系统选择什么字符集?这个字符集与数据库字符集一点关系都没有,系统管理员想选择什么就选择什么。

3、客户端操作系统选择什么字符集?我选择ZHS16GBK。

4、客户端操作系统参数NLS_LANG参数如何设置?这个只有一个设置方法,那就是与操作系统字符集相同。要不然会出问题的……

查询oracle server端的字符集

select userenv('language') from dual;

查询oracle client端的字符集
在windows平台下,就是注册表里面HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE\KEY_OraDb11g_home1
注册表在运行界面–regedit 进入

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Oracle 数据库中字符集的更改是一个复杂的过程,需要谨慎处理以避免数据丢失或损坏。以下是一个大致的步骤流程: 1. 停止数据库,并以管理员身份登录到操作系统上。 2. 备份数据库,在备份完成后,将备份文件复制到一个安全的位置。 3. 检查当前数据库中的字符集,以确定更改为哪种字符集,并创建一个新的字符集。 4. 使用 Oracle 提供的 Database Migration Assistant for Unicode 工具,检查并解决数据库中的字符集问题。 5. 在解决了字符集问题之后,使用 Oracle 提供的 CSSCAN 工具,扫描数据库中的所有数据,以确保没有任何数据丢失或损坏的风险。 6. 创建一个新的字符集的数据库,并将数据库参数设置为适合新字符集的值。 7. 使用 Oracle 提供的 Data Pump 工具,将原有的字符集的数据库中的数据导出到一个文件中。 8. 使用 Oracle 提供的 Data Pump 工具,将导出的数据文件中的数据导入到新的字符集的数据库中。 9. 调整新数据库中的对象,例如表、索引、视图等,以适应新的字符集。 10. 测试新的数据库,确保所有数据都已成功转换,并且应用程序可以正常访问新的数据库。 需要注意的是,这只是一个大致的步骤流程,具体的操作步骤可能会因为不同的环境和需求而有所不同。在进行这个过程之前,建议先仔细阅读 Oracle 文档,并咨询专业的数据库管理员或顾问的意见。同时,在进行字符集更改之前,应该充分备份数据,并进行必要的测试和验证。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值