Web乱码的本质-CSDN博客

本文链接：https://blog.csdn.net/zc655545/article/details/137556487

Web乱码的本质就是：客户端根据一套编码规则（例如UTF-8）将数据编码成字节流传输到服务端，而服务端根据另一套编码规则（例如ISO-8859-1）来对接收到的字节流进行解码，从而导致乱码的情况。反之亦然。

一个HTTP请求的流程分解

（1）客户端根据自己的编码规则发出HTTP请求；
（2）web服务器（例如Tomcat）将HTTP请求报文转换成request对象，同时生成一个response对象；
（3）请求到达servlet等Java程序，Java程序按照web服务器的编码规则从request域中取数据；
（4）Java程序按照web服务器中的编码规则返回HTTP响应对象；
（5）客户端按照自己的编码规则解码HTTP响应并展示。

解决乱码的思路：使客户端和服务端的编码解码字符集相同

（1）客户端乱码解决方法：
客户端乱码指的是，客户端在接收服务端发来的响应数据时，无法正确进行数据的解析，最常见的问题就是中文乱码。
在获取响应对象的字符输出流之前，设置一下ContentType，告诉客户端我返回的是哪一种MIME类型，以及我用的是哪一种编码方式，你再解析的时候就按照我给你的MIME类型以及编码方式来解析我给你返回的数据。

 response.setContentType("text/html;charset=utf-8");
 或者
 response.setHeader("Content-Type","text/html;charset=utf-8")
//Tomcat8之后默认的字符编码集就是utf-8，其实只需要设置MIME类型就行了，例如 response.setContentType("text/html");

（2）服务端乱码解决方法：
服务端乱码指的是，web服务器无法正确解析解析客户端发来请求数据，例如通过request.getParameter方法拿到的中文数据是乱码的。
在从请求对象中获取数据之前，设置请求对象的字符编码集。（Tomcat）

request.setCharacterEncoding("utf-8”)
//我的谷歌浏览器（版本 ：123.0.6312.86（正式版本） （64 位））的默认字符编码集也是utf-8，这句话可以省略
//可以通过F12在控制台输出document.charset来查看浏览器的默认字符编码集