一、首先是我们的ASCII码(美国信息交换标准嘛)
它只有一个字节大小(0-255),而我们查ASCII码表就可以知道,它其实只使用了127位。由于不能够表示所有的文字符号,后人对他进行了扩展。
二、ASCII码的扩展:GB2312或GB2312-80(128-255)
其中两个扩展码表示一个中文,但还是不能够表示全世界所有的文字字符。
三、UNICODE编码
它能表示的范围为(0-0x10FFFF)可以容纳100多万个符号,能给世界上存在的文字符号,给一定一个唯一的编码,很好的解决了前两种码不能够表示所有文字字符的问题。
但是它只限定了符号的二进制代码,却没有规定这个二进制代码如何进行存储。
四、如何存储UNICODE:UTF-16/UTF-8
UTF-16:以16位无符号整数为单位,注意的是16位为一个单位,不表示一个字符只有16位。
但是这种编码方式在进行网络传输时,有很大的弊端,他会浪费很多字节。
UTF-8:可变长的编码方式,一般以一个字节位单位,不够会增加。能够很好的节省空间。适合网络传
输,但是解析比较困难。