一、ASCII
ASCII (American Standard Code for Information Interchange) - 美国信息交换标准代码
由于计算机最初只支持英文,最先出现的字符编码:ASCII 码。
ASCII 码采用 1 个字节编码,共定义了128个字符。
二、GB2312、GBK、GB18030、Big5
随着计算机的不断发展,支持简体中文的字符集包括:GB2312 、GBK 、GB18030、Big5(繁体)。
中文一般使用 2 个字节编码,字符编码集容量大小: GB2312 < GBK < GB18030。
1、GB2312
规定中文占 2 个字节,小于 127 的编码按 ASCII 标准解释字符,当 2 个大于 127 的字符连在一起时,表示 1 个汉字。
2、GBK
规定对收录的每个字符采用 2 个字节表示,对于 ASCII 中的字符占 1 个字节。
3、GB18030
在 GBK 的标准上不断扩展字符,GB18030 的编码使用 4 个字节,兼容 GBK、GB2312 及 ASCII 标准。
即便使用 GB18