中文乱码问题
编码解码,与乱码问题原因
- 字符编码的概念
- 将字符转换成成二进制数据的过程,称为编码。
- 字符解码的概念
- 将二进制数据转换成字符的过程,称为解码。
- 中文乱码的原因
- 一段中文文本,如果使用A字符集进行编码,却使用B字符集进行解码,就导致原来的字符还原错误,所以导致乱码出现。
- 解决乱码的根本方法
- 统一编码和解码的字符集。
- 如果无法做到统一编码,解码。那么使用错误的解码字符集重新对”已经错误解码的数据“进行编码,从而还原成原来二进制流数据。然后再找正确的字符集进行编码。(不过推荐配置统一编码解码,而不是采用还原编码的形式处理。)
Servlet响应中文乱码问题与处理
-
响应数据乱码的原因:
- 服务器发回给浏览器的响应数据,之所以有乱码,是因为浏览器端不知道服务器端采用的何种格式进行的编码。所以采用了浏览器默认设置的编码进行了二进制数据流的解码。如果编解码字符集对应错误,那么就产生了中文乱码。(比如浏览器默认GBK,而服务器发回的数据采用UTF-8)
-
响应数据乱码的解决办法:
- 在响应数请求头中添加Content-Type,以及CharacterType来告诉浏览器,数据的文本格式以及编码格式。
resp.setContentType("text/html;charset=utf-8"); resp.getWriter().write("你好,这是中文乱码");
resp