1、ASCII是0~127位编码,包含了英文字符和其他常见的符号
2、DBCS(双字节字符集):GB2312、GBK标准、GB18030
- GBK2312:对ASCII的中文扩展,小于127的字符与ASCII相同,两个大于127的字符连接在一起表示汉字,第一个字节从0XA1~0XF7,第二个字节从0XA1~0XFE,只能表示常见的6000多个简体汉字
- GBK标准:对GBK2313的扩展,只要第一个字节大于127就表示汉字,能表示汉字和繁体字
- GBK18030:对GBK标准的扩展,可表示少数民族汉字
3、Unicode:字符集,用16位来表示所有字符,注意区分字符和字节区别(字符是文化表示,字节是物理存储单位)UTF-8、UTF-16是其编码实现
- UTF-8:以8位为编码单位,是一种变长的编码方式,使用1~4个字节表示以一个字符
- UTF-16:以16位为编码单位,是一种变长的编码方式,严格来讲UTF-16才是Unicode的编码实现