ASCII
本来只用前0-127号表示英文字母和符号,后来扩充的128-255字符集用来表示欧洲文字如法语,被称为“扩展字符集”,但后128个字符不规范不权威不统一,一般ASCII只认为有128个
ISO-8859-1
ISO-8859-1编码是单字节编码,向下兼容ASCII,其编码范围是0x00-0xFF,0x00-0x7F之间完全和ASCII一致,0x80-0x9F之间是控制字符,0xA0-0xFF之间是文字符号。
GB2312
中国人把ASCII里127后的符号取消,规定前127个符号与原来相同。两个大于127的字符在一起组成一个汉字,还包括了数学符号,平假名,罗马字母等,尤其把ASCII中原有的数字,标点,字母都重新编码两个字节长的编码,即全角字符,127以下的那些就叫做半角字符。GB2312 是对 ASCII 的中文扩展。
GBK
GB2312的两个字节是“大大”,GBK扩充了“大小”也表示汉字,英文字符仍为一字节。GBK 包括了 GB2312 的所有内容,同时又增加了近20000个新的汉字(包括繁体字)和符号。</