一文教你彻底理解字符编码

字符编码时间轴

  • SBCS(1963)
  • DBCS(1980):
  • MBCS(1990):

字符编码详解

SBCS

Single-Bytes Character Set,单字节字符集

  • ANSI (1963)
  • EBCDIC (1964)

DBCS

Double Byte Charecter Set 双字节字符集

  • GB2312(信息交换用汉字编码字符集——基本集 1980):
    包含一级汉字3755个,二级汉字3008个

  • Big5:
    台湾同胞发明,其中繁体汉字13053个,808个标点符号、希腊字母及特殊符号。 为了解决GB2312不支持繁体的问题

  • GBK (Chinese Internal Code Specification )
    收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库

  • GB18030
    包含了 GBK + 3000少数民族字

MBCS

Muilti-Bytes Character Set,多字节字符集

  • Unicode (1990)
    容纳100多万个符号。采用统一的 四字节, UCS-2, UCS-4
  • UTF - 8 / 16 / 32 (1992)
    为了解决 Unicode 消耗内存的问题, 出现的一种新的编码, 采用 一到四字节 可变长编码风格,
    根据特定编码算法可以将 UTF 转换为 Unicode.

用通信理论的思路可以理解为: unicode是信源编码,对字符集数字化; utf8是信道编码,为更好的存储和传输

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值