之前总是困惑几种编码之间的关系,看了两篇文章总结下
Acsii编码:最初的英文编码方式,只有一个字节,并且只有128个符号;
GB系列编码:中国人弄出的编码,GB2312就是一个中文编码的拓展,保留之前的127号字符,但多加了一个字节并且两个大于127的连一起表示汉字,其余为字母标点之类的,成为全角,从前127号以下的称为半角;
GBK编码:GB的进化版,由于中文字符太多,对之前的GB编码再优化,只需要第一个字节大于127;
Big5编码:台湾人搞得编码方式,主要对繁体字;
Unicode:为了统一世界各地的编码,由ISO来定制出来,是一个符号集,不是编码,规定了符号的二进制代码,但没规定怎么去存,比如汉字‘严’的Unicode值为4E25,有至少两个字节;
Utf-8编码:互联网上最流行unicode编码方式,是变长的编码方式,可以节省不少空间;
Big/Small Endian:大小端,网络传输方面应用。
http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html