编码与解码
- 编码:将字符转换为二进制数
汉字 | 编码方式 | 编码 | 二进制 |
---|---|---|---|
‘中’ | GB2312 | D6D0 | 1101 0110-1101 0000 |
‘中’ | UTF-16 | 4E2D | 0100 1110-0010 1101 |
‘中’ | UTF-8 | E4B8AD | 1110 0100- 1011 1000-1010 1101 |
- 解码:将二进制数转换为字符
1110 0100-1011 1000-1010 1101 → E4B8AD → ’中’
- 乱码:一段文本,使用A字符集编码,使用B字符集解码,就会产生乱码。所以解决乱码问题的根本方法就是统一编码和解码的字符集。
解决乱码问题
-
解决乱码的方法:就是统一字符编码。
-
浏览器与服务器默认的编码与解码字符集情况
- 服务器编码与解码是一致的,为:ISO-8859-1
- 浏览器编码为:<meta charset=“UTF-8”>
- 浏览器解码为:GBK(支持少量中文)
请求乱码
GET请求
- GET请求参数是在地址后面的。我们需要修改tomcat的配置文件。需要在server.xml文件修改Connector标签,添加URIEncoding="utf-8"属性。
-
<Connector URIEncoding="UTF-8" connectionTimeout="20000" port="8080" protocol="HTTP/1.1" redirectPort="8443"/>
- 一旦配置好以后,可以解决当前工作空间中所有的GET请求的乱码问题。
POST请求
- post请求提交了中文的请求体,服务器解析出现问题。
- 解决方法:在获取参数值之前,设置请求的解码格式,使其和页面保持一致(h5默认是utf-8)。
-
request.setCharacterEncoding("utf-8");
- POST请求乱码问题的解决,只适用于当前的操作所在的类中。不能类似于GET请求一样统一解决。因为请求体有可能会上传文件。不一定都是中文字符。
响应乱码
- 向浏览器发送响应的时候,要告诉浏览器,我使用的字符集是哪个,浏览器就会按照这种方式来解码(servlet(服务器)默认用ISO-8859-1来编码,浏览器默认使用GBK来解码)。
- 修改servlet(服务器)编码格式
-
response.setCharacterEncoding("UTF-8");
-
- 修改浏览器解码格式
- 解决方法一:
-
response.setHeader("Content-Type", "text/html;charset=utf-8");
-
- 解决方法二(常用):
-
response.setContentType("text/html;charset=utf-8");
-
- 解决方法一:
注意
所有的编码与解码设置必须在数据使用之前,通常我们可以将这些代码放在方法中的首行