字符编码形式:
ZHS16CGB231280,混合字节编码,ASCII用单字节存储,汉字用双字节存储;没有实现全部汉字的编码,范围是00-FFFF。
UCS-2,双字节Unicode编码,每个字符都用两个字节存储,范围是0000-FFFF。
UTF8,混合字节Unicode编码,有些字符用1个字节存储,有些用2个字节,有些用3个字节;不能笼统的说英文是1个字节,汉字是三个字节,虽然基本上是这样。
请求的日志和查看输出是乱码
解决方法:Install-->viewer option-->去掉"Allow Native Client Encoding",如果是PDF报表乱码,在所有的JRE下面的lib/fonts下面拷贝中文字体。
Copy ALBAN*.ttf from $FND_TOP/resource to $OA_JRE_TOP/jre/lib/fonts and $AF_JRE_TOP/jre/lib/fonts
查看数据库编码:
select * from sys.props$ where name='NLS_CHARACTERSET';
设置数据库编码:set nls_lang=AMERICAN_AMERICA.数据库字符集
数据库字符集:select * from nls_database_parameters;
Select dump('TEST') from dual; -- 查看字符编码
SELECT unistr('\9648') FROM dual;
数据库可用字符集:
SELECT * FROM V$NLS_VALID_VALUES
编码优先级:alter session>环境变量(系统环境变量NLS_LANGUAGE)>注册表(home中nls)>参数文件
Oracle 数据库支持的数据编码转换:
select * from v$nls_valid_values where parameter='CHARACTERSET';
Oracle EBS在编码方式为AL32UTF8时的注意事项
现如今的EBS系统中,为了推进国际化的进程,以及系统向全球化的扩展,在Oracle数据库的编码方式上渐渐从支持中国本土简体中文的ZHS16GBK转向了更趋于国际化的AL32UTF8编码方式。但随之而来在中国就会产生很多问题,例如:
- 其他的外围系统仍然使用简体中文GB2312/ZHS16GBK编码,在接口文件传输时由于编码不一致而产生乱码问题
- Excel不兼容,简体中文版的Excel在读取文本文件时采用的是默认的简体中文编码方式打开,所以已UTF-8编码的文件(如CSV文件)在打开时会产生乱码问题
所以在中国的IT系统,一旦选择采用了AL32UTF8的国际化编码方式之后,了解一些编码方式的区别以及常见问题的解决方法是非常必要的。
编码方式
这里就不深入讨论编码的知识了,简单阐述一下二者的不同之处,见如下表格:
编码方式 | 隶属于 | 一个中文字符所占字节 | 说明 |
ZHS16GBK | ANSI | 2 | 与所有隶属于ANSI的编码兼容 |
AL32UTF8 | Unicode | 3 | 与所有隶属于Unicode的编码兼容 |
所以二者属于两套字符集衍生出来的,所以并不兼容,需要显示的进行转码才能正常显示。
PLSQL/SQL客户端的配置
客户端配置需要考虑Oracle Client的所支持的语言和注册表中NLS_LANG键值的设置。
- Oracle客户端需要安装兼容64为的32位客户端:win32_11gR2_client,具体请从Oracle官方网站上进行下载;
- NLS_LANG的键值需要设置成"AMERICAN_AMERICA.AL32UTF8" 或者 "SIMPLIFIED CHINESE_CHINA.AL32UTF8" [cmd ]
EBS基础设置
请确保一下表格中列示的配置文件已经设置了正确的值:
配置文件名称 | 设置层 | 配置文件值 |
FND: NATIVE CLIENT ENCODING | SITE | UTF8 |
ICX: Client IANA Encoding (ICX:客户机 IANA 编码) | SITE | Unicode (UTF-8) |
当为文本类型输出格式设置新的打开方式时,请确保"Allow Native Client Encoding"已经勾选。
报表类程序(HTML, HTML as EXCEL, PDF)
对于HTML的报表,需要在HTML头上指定encoding为utf-8:<meta http-equiv="Content-Type" content="text/html;charset=utf-8"/>
另外编码方式可以用一下代码动态从系统中获取:
l_encoding := fnd_profile.value('ICX_CLIENT_IANA_ENCODING');
对于PDF输出类报表,以上获取编码方式的方法仍然适用,并填充值XML的头部:
<?xml version="1.0" encoding="utf-8"?>
另外,如果报表输出的中文全部显示成问号"?",那么这种情况并不是编码方式导致的,而是服务器上缺失了必要的字体文件,在后台运行如下脚本复制字体文件到指定目录下:
#!/bin/sh
cp $FND_TOP/resource/ALBAN*.ttf $AF_JRE_TOP/lib/fonts
文件读写及外部接口兼容
1. 文件输出
对于从Oracle生成并输出的文本文件,默认的编码方式肯定是UTF-8(无BOM)的。所以一旦目标系统的编码方式是简体中文的话,那么转码的步骤一定是必须的。我们可以从两个阶段入手进行转码。
第一个阶段是在每一批写入文件的数据在写入文件之前强制利用CONVERT函数进行转码,如:
l_converted_str := CONVERT('你好', 'ZHS32GB18030');
第二个阶段是就是在文件生成之后,利用相对高级的文本编辑器,如Notepad++,对文件进行转码UTF-8 -> ANSI
2. 文件读取
与文件类似,只不过只能利用文本编辑器提前转码之后方能被Oracle处理。
Excel文件输出和Export导出
utf-8格式的csv或分割符文件在excel打开会出现乱码的情况:
utf-8格式的文本文件
利用文本编辑器进行转码后方能正确显示:
ansi格式的文件
总结
1. 检查配置文件和View Options是否设置正确
2. HTML格式报表记得要动态从系统中获取encoding
3. PDF报表记得安装字体
4. 输出到外部的文件需要进行必要转码操作(convert函数或文本编辑器)
来自 <http://www.cnblogs.com/objectorl/p/al32utf8-zhs16gbk-in-oracle.html>