各种字符集(整理学习)

      为国际市场开发应用程序的一个重要方面就是要适当地表示本地字符集。

     (一)单字节字符集(SBCS)

      此字符集,只占用一个字节,主要是两种字符集ASCII和ANSI。

      ASCII(American Standard Code for Information Interchange,美国信息互换标准代码),占用7位,共128个字符。在 0x00 到 0x7F 的范围内定义字符。

      ANSI字符集(American National Standards Institute Processing--8-Bit Single-Byte Coded Craphic Character Sets),又叫扩展ASCII码,该字符集除了包含ASCII字符外,还有其他一些字符集(主要是欧洲字符)。在 0x00 到 0x7F 的范围内定义与 ASCII 字符集相同的字符,在 0x80 到 0xFF 的范围内定义了扩展字符集。因此,8 位的单字节字符集 (SBCS) 足以表示 ASCII 字符集以及许多欧洲语言的字符集。

     (二)MBCS字符集(多字节字符集)

      一些非欧洲字符集(如日文汉字)包含许多单字节代码方案无法表示的字符,因此要求使用多字节字符集 (MBCS) 编码。连续2个扩展ASCII码的扩展区域(0xA0以后)来表示一个汉字,该方法的标准叫GB-2312(国标),之后又扩展出GBKGB18030。后来,日文、韩文、阿拉伯文、台湾繁体...都使用类似的方法扩展了本地字符集的定义现在统一称为 MBCS字符集(多字节字符集,既用多个字节表示一个字符)。其实最常见的还是用2个字节表示一个字符,称为DBCS(双字节字符集)。此类常见字符集有gb2312(中国),big5(中国台湾地区),jis(日本)...。多字节字符集(MBCS)兼容单字节字符集(SBCS),通常并不区分他们。同SBCS一样,MBCS字符串也由一个零字节结尾,数据类型也是char

     (三)Unicode(宽字节字符集)

      Unicode 是为所有语言提供足够编码的 16 位字符编码。所有 ASCII 字符都作为“加宽”字符包含在 Unicode 中。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值