Unicode是字符集:每个字符对应一个码位
Unicode是万国码,包含所有国家的字符
Ascii码为英文字符集,每个字符为一个字节
GB18030为中文字符集,每个中文字符对应两个英文字符
字节”是一个8位的物理存贮单元,而“字符”则是一个文化相关的符号。
UTF-8是编码规则:将码位转换为字节序列的规则
UTF-8最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度,当字符在ASCII码的范围时,就用一个字节表示,保留了ASCII字符一个字节的编码做为它的一部分,注意的是unicode一个中文字符占2个字节,而UTF-8一个中文字符占3个字节。