» 目录 |
简 体中文系统环境支持国标 GB2312、GB18030 和 Unicode (UTF-8) 编码。它们在系统中设置的locale(亦指语言别)名称为:
国标 GB2312: zh_CN.hp15CN
国标 GB18030: zh_CN.gb18030
Unicode (UTF-8): zh_CN.utf8
国标 GB2312 是基于 1980 年发布的《信息交换用汉字编码字符集基本集》,是中文信息处理的中国国家标准,是强制执行的中文编码。
国 标码共收录 6763 个简体汉字、682 个符号,其中汉字部分:一级字 3755 个,以拼音排序,二级字 3008 个,以偏旁部首排序。该标准的制定和应用为规范、推动中文信息化进程起了很大作用。该标准用双字节表示一个汉字:
高字节 A1-F7(其中字符区 A1-F9,汉字区 B0-F7)
低字节 A1-FE
国标 GB18030 基于 2000 年 3 月发布的《信息技术信息交换用汉字编码字符集基本集的扩充》,是最新推出的中国国家强制执行中文信息处理标准编码。
该标准涵盖了单字节、双 字节、四字节的字符和汉字,共计约 28,000 多个。
注意: GB18030 编码的文件及 locale zh_CN.gb18030 现在只能用于 HP-UX 11i 的操作系统。 | |
HP 依据 Unicode UTF-8 添加的支持简体中文的编码。它与 ISO-IEC 10646 一一对应,ISO-IEC 10646 是由国际标准组织 (ISO) 及国际电工联盟 (IEC) 于 1993 年所制定。而 HP 采用的是 UTF-8 (UCS Transformation Format-8) 转换格式,作为 Unicode 在 HP-UX 上的编码架构(有别于Microsoft Windows NT® 或 Windows® 2000 所采用的 UCS2 编码架构),以用在 HP-UX 多 8 位编码环境。
现 HP-UX 支持的 zh_CN.utf8 字符集涵盖 GB2312 的全部字符。