Web开发过程中乱码问题

Springmvc、get/post提交乱码

淡泊以明志,宁静以致远

昨天在用springmvc开发Web项目时,遇到了乱码问题,弄了将近5个小时才弄好。希望我遇到的问题可以帮助到大家。
【问题描述】我在JSP页面通过超链接访问Controller,请求的地址中有中文,例如

<a href="http://localhost:8080/mydemo/user/save?uname='中'">链接</a>

但是到达Controller中取出来确实乱码。为什么会产生乱码呢?怎样处理这样的乱码呢?在彻底解决这个问题之前,我们需要对编码、解码的基础知识有一定的了解。这就是所谓的“工欲善其事,必先利其器”。

一、编码的基础知识

(一)为什么要编码?

我们和浏览器交互使用的是字符,我们发送给服务器的请求在网路间是通过字节流传输的。所以,我们发送的请求要结果编码,服务器接收到请求后要进行解码。

(二)什么是编码和解码?

这里写图片描述
上面就是编码、解码和字符集的基础概念。编码有两种方式:第一种就是通过字符集进行编码和解码;第二种就是URI编码、URI解码
当然在进行URI编码时,也要有对应的字符集。比如,“中”通过URI编码后的结果是“%E4%B8%AD%”。这里同样使用了utf-8字符集。(”中”的urf-8编码是”E4B8AD”)很容易看出来,URI编码就是将一个字符串用%+对应的字符集编码组织的字符串来表示的。

(三)URI编码(理解重点)

什么时候会进行URI编码呢?URI编码会对我们发送请求的地址进行编码。例如上面。

<a href="http://localhost:8080/mydemo/user/save?uname='中'">链接</a>

URI会对后面请求的地址进行编码。默认是由浏览器进行的。不同的浏览器,在不同的操作系统中在进行URI编码时,采用的字符集不同。所以,我们的解决方案是在页面先通过JavaScript中的URLEncode函数对中文先进行URI编码,这样我们就可以指定字符集了。然后把编好码的结果放到地址中,进行请求。
但是,我遇到的问题并不是这个问题。因为如果我们不手动进行URI编码,浏览器也会根据网页中的charset中指定的字符集进行编码。

<%@ page language="java" import="java.util.*" pageEncoding="utf-8"%>
<%@ page contentType="text/html;charset=utf-8"%>
(四)从页码请求到服务器接收请求后流程图

①原URL(请求地址)
②Get提交,浏览器根据http头的Content-Type的charset对URL进行URI编码

<%@ page contentType="text/html;charset=utf-8"%>

Post提交,浏览器根据http头的

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

对URL进行URI编码。
或者利用Javascript使用指定字符集手动对URL进行编码。
④编码后的URL全是ASCII码。
⑤然后浏览器把URL以iso-8859-1编码方式转换成二进制的字节码,进行网路传输。这里有个理解重点:iso-8859-1中是没有中文的。
⑥随请求头一起发送出去(get无实体,post有实体)
⑦服务器接收到浏览器发送过来的URL,并用iso-8859-1进行解码
⑧网页一般都会有meta头的charset选项,服务器根据此进行再次解码(post表单提交过来的也会根据此编码进行解码)。但是这个只使用于post方式提交的请求。
⑨最后就得到正确的值。

然而到达这里问题似乎还是没有解决,不过问题的原因可以推测出来了。问题就是iso-8859-1中是没有中文的。通过get方式提交的请求,URL还是会根据服务器默认的iso-8859-1进行解码,没有对应的中文解码,所以产生了乱码。

(五)URIEncoding和useBodyEncodingForURI

在我开发过程中用的是Tomcat 6x,所以我又去了解了一下Tomcat对Get的URL解码相关知识。
Tomcat默认是按iso-8859-1进行URL解析,而iso-8859-1中没有中文,所以产生乱码,这里刚才分析过了。
常见的解决方式是:在tomcat的server.xml下的connetor属性中增加URIEncoding或者useBodyEncodingForURI属性。
按照tomcat-docs/config/http.html文档的说明
**URIEncoding:**This specifies the character encoding used to decode the URI bytes, after %xx decoding the URL. If not specified, ISO-8859-1 will be used.
**useBodyEncodingForURI:**This specifies if the encoding specified in contentType should be used for URI query parameters, instead of using the URIEncoding.

也就是说,
useBodyEncodingForURI参数表示是否用request.setCharacterEncoding参数对URL提交的数据和表单中GET方式提交的数据进行重新编码,在默认情况下,该参数为false。
URIEncoding参数指定对所有GET方式请求进行统一的重新编码(解码)的编码。
URIEncoding和useBodyEncodingForURI区别是,URIEncoding是对所有GET方式的请求的数据进行统一的重新编码,而useBodyEncodingForURI则是根据响应该请求的页面的request.setCharacterEncoding参数对数据进行的重新编码,不同的页面可以有不同的重新编码的编码。

所以,最终的解决方案就出来咯。在tomcat的server.xml下的connetor属性中增加URIEncoding属性。
这里写图片描述

最后,补充一个相关的知识点:
大家都知道,我们在使用springmvc进行Web项目开发时,会在web.xml中配置字符编码过滤器。

<filter>
    <filter-name>encodingFilter</filter-name>
    <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>
    <init-param>
        <param-name>encoding</param-name>
        <param-value>UTF-8</param-value>
    </init-param>
    <init-param>
        <param-name>forceEncoding</param-name>
        <param-value>true</param-value>
    </init-param>
</filter>

<filter-mapping>
    <filter-name>encodingFilter</filter-name>
    <url-pattern>/*</url-pattern>
</filter-mapping>

但是这个配置是针对post请求的。这下关于编码使用的就相对完整了。


最后感谢一下参考博客,谢谢您们的分享:
http://blog.csdn.net/superch0054/article/details/9325793

http://www.cnblogs.com/liukemng/p/4178882.html

http://blog.sina.com.cn/s/blog_8a18c33d0101aabe.html

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值