字符-->字节、字节-->字符时需要用到编码(Encoder)、解码(Decoder)
几种编码:
ASCII:总共128
ISO-8859-1:涵盖大部分西欧语言字符。一个字符一个字节表示
gbk2312:包含6000多的汉字,一个英文字符一个字节表示,一个汉子两个字节表示。
gbk:包含20000多个汉字,包含gbk2312所有编码。
utf-16:每个字符用两个字节表示。jvm的编码方式。效率最高
utf-8:英文用一个字节表示,汉字用三个字节表示。适合网络之间传输的编码方式。
Servlet:
1.接收get方式,得到的是与页面编码方式一样的,但解码需要在服务器配置文件中修改。可以用一种不正常的方式解决,如String的构造函数,
new String(request.getParameter("name").getBytes("ISO-8859-1"),"utf-8")
1.1get方式还可以修改tomcat配置文件添加编码与工程编码一致,如下:
<Connector URIEncoding="utf-8" connectionTimeout="20000" port="8080" protocol="HTTP/1.1" redirectPort="8443"/>
2.接收post方式需要在web.xml中配置一下过滤器
<!-- post乱码过虑器 --> <filter> <filter-name>CharacterEncodingFilter</filter-name> <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class> <init-param> <param-name>encoding</param-name> <param-value>utf-8</param-value> </init-param> </filter> <filter-mapping> <filter-name>CharacterEncodingFilter</filter-name> <url-pattern>/*</url-pattern> </filter-mapping>
MySQL:
要与数据库的编码一致:url="jdbc:mysql://localhost:3306/DB?useUnicode=truecharacterEncoding=gbk"
JS/html:
默认编码是utf-8
常见问题:
1.中文变成看不懂的字符:gbk-->iso-8859-1
2.一个汉子变成一个问号:iso-8859-1-->iso-8859-1
3.一个汉子变成两个问号:gbk-->iso-8859-1-->gbk-->gbk
可以加微信群一起交流