支持的简体中文编码

内容从此开始:

 » 目录

简 体中文系统环境支持国标 GB2312、GB18030 和 Unicode (UTF-8) 编码。它们在系统中设置的locale(亦指语言别)名称为:

国标 GB2312: zh_CN.hp15CN

国标 GB18030: zh_CN.gb18030

Unicode (UTF-8): zh_CN.utf8

国标 GB2312 编码 (zh_CN.hp15CN)

国标 GB2312 是基于 1980 年发布的《信息交换用汉字编码字符集基本集》,是中文信息处理的中国国家标准,是强制执行的中文编码。

国 标码共收录 6763 个简体汉字、682 个符号,其中汉字部分:一级字 3755 个,以拼音排序,二级字 3008 个,以偏旁部首排序。该标准的制定和应用为规范、推动中文信息化进程起了很大作用。该标准用双字节表示一个汉字:

高字节 A1-F7(其中字符区 A1-F9,汉字区 B0-F7)

低字节 A1-FE

国标 GB18030 编码 (zh_CN.gb18030)

国标 GB18030 基于 2000 年 3 月发布的《信息技术信息交换用汉字编码字符集基本集的扩充》,是最新推出的中国国家强制执行中文信息处理标准编码。

该标准涵盖了单字节、双 字节、四字节的字符和汉字,共计约 28,000 多个。

注意: GB18030 编码的文件及 locale zh_CN.gb18030 现在只能用于 HP-UX 11i 的操作系统。

Unicode (zh_CN.utf8)

HP 依据 Unicode UTF-8 添加的支持简体中文的编码。它与 ISO-IEC 10646 一一对应,ISO-IEC 10646 是由国际标准组织 (ISO) 及国际电工联盟 (IEC) 于 1993 年所制定。而 HP 采用的是 UTF-8 (UCS Transformation Format-8) 转换格式,作为 Unicode 在 HP-UX 上的编码架构(有别于Microsoft Windows NT® 或 Windows® 2000 所采用的 UCS2 编码架构),以用在 HP-UX 多 8 位编码环境。

现 HP-UX 支持的 zh_CN.utf8 字符集涵盖 GB2312 的全部字符。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值