Web乱码的本质就是:客户端根据一套编码规则(例如UTF-8)将数据编码成字节流传输到服务端,而服务端根据另一套编码规则(例如ISO-8859-1)来对接收到的字节流进行解码,从而导致乱码的情况。反之亦然。
一个HTTP请求的流程分解
(1)客户端根据自己的编码规则发出HTTP请求;
(2)web服务器(例如Tomcat)将HTTP请求报文转换成request对象,同时生成一个response对象;
(3)请求到达servlet等Java程序,Java程序按照web服务器的编码规则从request域中取数据;
(4)Java程序按照web服务器中的编码规则返回HTTP响应对象;
(5)客户端按照自己的编码规则解码HTTP响应并展示。
解决乱码的思路:使客户端和服务端的编码解码字符集相同
(1)客户端乱码解决方法:
客户端乱码指的是,客户端在接收服务端发来的响应数据时,无法正确进行数据的解析,最常见的问题就是中文乱码。
在获取响应对象的字符输出流之前,设置一下ContentType,告诉客户端我返回的是哪一种MIME类型,以及我用的是哪一种编码方式,你再解析的时候就按照我给你的MIME类型以及编码方式来解析我给你返回的数据。
response.setContentType("text/html;charset=utf-8");
或者
response.setHeader("Content-Type","text/html;charset=utf-8")
//Tomcat8之后默认的字符编码集就是utf-8,其实只需要设置MIME类型就行了,例如 response.setContentType("text/html");
(2)服务端乱码解决方法:
服务端乱码指的是,web服务器无法正确解析解析客户端发来请求数据,例如通过request.getParameter方法拿到的中文数据是乱码的。
在从请求对象中获取数据之前,设置请求对象的字符编码集。(Tomcat)
request.setCharacterEncoding("utf-8”)
//我的谷歌浏览器(版本 :123.0.6312.86(正式版本) (64 位))的默认字符编码集也是utf-8,这句话可以省略
//可以通过F12在控制台输出document.charset来查看浏览器的默认字符编码集