无论是UTF-8还是GBK都是在ASSIC的基础上进行扩充的,为什么要进行扩充?
因为ASSIC对于使用英文的国家来说足够了,ASSIC占一个字节,最多可以存放255个字符,而英文字母才26个,再包括其他的字符,也才128个,但对于其他国家,像中国,日本.....,根本不够用,汉字就有10万个。
unicode编码:字母和汉字统一使用两个字节(比较占用空间)
uft-8 编码(使用最广):字母一个字节,汉字三个字节(灵活)
gbk编码:字母一个字节,汉字两个字节(对于汉字来说存储数量就不如utf-8,)
如果将utf-8编码保存的文件转成gbk可能会出错。
注意:这些编码都是在ASSIC的基础上进行的扩充,并没有改变原ASSIC中的对应关系。