参考深入分析javaweb技术内幕第三章
常见编码类型
1,ASCII码:
单字节编码,共128字符,用1个字节的低七位表示,0-31是控制字符如换行,回车,删除等,32-126是打印字符,可以通过键盘输入并且能够显示出来
2,ISO-8859-1
在ASCII码基础上扩展的编码,包括ISO-8859-1到ISO-8859-15,其中ISO-8859-1涵盖了大多数西欧字符,所以应用的最广泛。单字节编码,共256个字符
3,GB2312
全称“信息技术中文编码字符集”,双字节编码,编码范围A1-F7,其中A1-A9是符号区,总共包含682个符号;B0-B7是汉字区,包含6763个字汉
4,GBK
全称“汉字内码扩展规范”,为了扩展GB2312而出现,编码范围是8140-FEFE(去掉XX7F),总共有23940个码位,能表示31003个汉字;兼容GB2312,可以用GBK解码GB2312的汉字
5,GB18030
全称是“信息技术 中文编码字符集”,是我国的强制标准,它可能是单字节,双字节或者四字节编码,它的编码与GB2312兼容,实际应用中不广泛
6,UTF-16
用两个字节来表示Unicode的转化格式,采用定长的表示方法,16bit,所以叫