万国码的基本知识点
- 万国码是由
国际标准组织
和统一码联盟
共同制定的. - 万国码有两个版本,第一个版本的最大编码长度是2个字节,第二个版本的最大编码长度是4个字节.
万国码的实现
- 万国码的实现分为两个层次:
理论编码
、实际存储编码
- 理论编码就是抛开计算机不管,通过数据计算得出的编码.
- 实际存储编码就是实际在计算机中存储的编码.
理论编码
和实际存储编码
并不相同,这也是万国码比其他编码难理解的原因之一.- 万国码的
理论编码
方案有ucs2
和ucs4
两种。- ucs2就是第一版万国码
- ucs4就是第二版万国码
- 这两种方案目前都在使用,且ucs4兼容ucs2
实际存储编码
方案ucs2
有ucs-2
、utf-8
ucs4
有utf-8
、utf-16
、utf-32