浅谈Unicode和UTF-8、UTF-16、UTF-32以及它们之间的关系
Unicode
定义:Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。
作用: 能够使计算机实现跨语言、跨平台的文本转换及处理。
层次: Unicode 编码系统,可分为编码方式和实现方式两个层次。
Unicode编码表:
UTF-32
这个就是字符所对应编号的整数二进制形式,四个字节。这个就是直接转换。 比如马的 Unicode 为:U+9A6C&#