中文字符集介绍:
GB2313包括6763个汉字
GBK收录了20902个汉字
GB18030收录了27484个汉字
GBK收录了20902个汉字
GB18030收录了27484个汉字
注:从ASCII、GB2312、 GBK到GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。
总结:
GB2312=ASCII+常用汉字+符号
GBK=GB2312+不常用字(含BIG5繁体汉字)+图形符号
GB18030=GBK+Ext-A+图形符号
Unicode=GB18030+Ext-B+……(如未发布的Ext-C及其它国家文字)
注意:Unicode的汉字编码与前三者不一样,UTF-8是Unicode的实现方式之一。
GB2312=ASCII+常用汉字+符号
GBK=GB2312+不常用字(含BIG5繁体汉字)+图形符号
GB18030=GBK+Ext-A+图形符号
Unicode=GB18030+Ext-B+……(如未发布的Ext-C及其它国家文字)
注意:Unicode的汉字编码与前三者不一样,UTF-8是Unicode的实现方式之一。
AIX系统中:
AIX的中文汉字库中,zh_CN 中有6763个汉字,而ZH_CN中有20902个汉字。如果用户要用到一些比较偏僻的汉字,建议用户安装中文环境时选择ZH_CN。
GBK的意思是 Guo (national) Biao (Standard) Kuo (Extension).
GB18030 将国家标准定义进行了扩展,包含 20902 个汉字, 它定义了所有 DBCS 字符以及中国大陆及台湾地区使用的符号
GB18030 将国家标准定义进行了扩展,包含 20902 个汉字, 它定义了所有 DBCS 字符以及中国大陆及台湾地区使用的符号
注:AIX中各字符集的区别在于zh_CN的大小写。
常用命令:
查看已经安装的字符集
locale -a
注:
"C"是系统默认的locale,"POSIX"是"C"的别名。所以当我们新安装完一个系统时,默认的locale就是C或POSIX
查看当前系统使用的字符集
env | grep LANG 或者 locale
修改整个系统的字符集
vi /etc/environment --> LANG=Zh_CN
修改单个用户的字符集
vi .profile --> EXPORT LANG=xxx