
Unicode和UTF-8、UTF-16到底有什么不同?
前面介绍过,UTF-8、UTF-16、UTF-32 是 Unicode 码表示成不同的二进制格式的编码规则,同样,通过这三种编码的二进制表示,也能获得对应的 Unicode 码,有了字符的 Unicode 码,按照上面介绍的 UTF-8、UTF-16、UTF-32 的编码方法 就能转换成任一种编码了。前面提到过,"中"字的 Unicode 码是4E2D, 它小于0x10000,根据表格可知,它的 UTF-16 编码占两个字节,并且和 Unicode 码相同,所以"中"字的 UTF-16 编码为4E2D。


