Oracle数据库多语言文字存储解决方案（一）

最新推荐文章于 2022-08-02 09:38:48 发布

lanye326

最新推荐文章于 2022-08-02 09:38:48 发布

阅读量861

点赞数

文章标签：语言 oracle 数据库存储物流 os

本文链接：https://blog.csdn.net/lanye326/article/details/3299561

版权

本文介绍了Oracle数据库如何处理多语言文字存储，探讨了字符集的概念，包括ASCII、GBK、Big5、Euc-kr等，以及Unicode（UTF7, UTF8, UTF16）的角色。讨论了不同字符集之间的不兼容性，并举例说明了字符编码在不同字符集中的转换问题，以及Windows操作系统如何处理非Unicode程序的字符集。" 127173841,15230146,Linux文件与目录管理详解,"['Linux', '运维', '服务器']

摘要由CSDN通过智能技术生成

Oracle数据库多语言文字存储解决方案（一） - [ oracle ]

一、关于字符集

字符集（也称字元集，Character Set）就是字符编码表(codepage)，一个字符不论英文、中文、韩文等在计算机系统内存或硬盘中通过二进制的字节（Byte）保存，这个二进制的编码就是字符编码（也称内码），字符集就是字符与内码的对应（映射）表。

因为多国语言的原因，就出现了根据本国语言制作的字符集。如使用最广泛的ASCII编码，由美国国家标准局(即ANSI)制定，适用于所有拉丁、英文字符。中国大陆使用GB2312,GBK,GB18030等字符集，这些字符集包含所有汉字字符的内码，其中GBK,GB18030称为大字符集，对繁体中文也进行了编码。香港、台湾、澳门地区使用Big5编码，Big5收录了繁体中文（有些繁体与中国大陆繁体字符有差异）的编码，不包含简体中文的字符编码。韩文使用euc-kr的字符集，韩文中也有很多汉字，所以字符集包括很多汉字字符的编码。其他如日文、俄文等都有自己国家制定的字符集，用来保证计算机系统能正确显示本国的语言文字。不同语言的字符集不具有通用性，ASCII字符集没有制定中文字符的编码，GB2312没有制定韩文字符的编码，Big5没有制定简体中文字符的编码，针对这种不兼容性，官方发布了Unicode（进一步优化的UTF7,UTF8,UTF16等）字符集，对每一种语言的每个字符制定了统一且唯一的内码，满足跨语言、跨平台的字符解码和转换处理。