关于jsp访问路径带中文值需encodeURI两次的原因

jsp往后台传值的时候,一般可以通过路径传值和ajax传值。

其中通过ajax post传值不会出现中文乱码现象,但路径传值如果不通过特殊的编码,后台可能获取到的是一串乱码。

encodeURI可以帮助我们完成中文编码,encodeURI默认是采用utf-8进行编码的。其中中文在utf-8的编码格式中是由3个字节组成,每个字节转成16进制后会在前面添加一个%。

    如 '江' 编码一次后 -> '%E6%B1%9F'

但是后台获取数据的时候,会自动对值进行解码,此时后台解码的格式可能是'iso-8859',而%会被当作转义字符,那么解码后就可能出现一堆乱码了。

因此此处需要对中文进行两次编码,将'%'也编码一次->'%25',这样不论后台是什么解码格式,得到的值都将是中文utf-8编码一次的结果。

    如 '江' 编码两次后 -> '%25E6%25B1%259F'

    后台对uri路径值 自动解码一次 ->'%E6%B1%9F'

    再通过URLDecoder.decode()方法对值进行'utf-8'格式解码 -> '江'

ps: ajax load()方法传中文参数的时候,只需要encodeURI一次

URL 中中文转码

1.将字符串转码:newString(“xxxxx”.getBytes("iso-8859-1"),"utf-8")

这种转码方式有很大的弊端,因为它是使用指定的字符集将此String编码为byte 序列,并将结果存储到一个新的byte 数组中,然后通过使用指定的字符编码将生成的byte 数组解码,构造一个新的String字符串。这种情况就有可能遇到的情况是,不能将一个汉字全部解码完。这样,前边的都能正常显示,但是最后一个字可能是乱码。

所以不建议使用这种方式。

2.在传参前转码,接收参数后再转码回来。

这种方式有两种:

第一种:

传参前:使用java.net.URLEncoder.encode("xxxx",“utf-8"),将中文转为16进制字符。

接收参数后:使用java.net.URLDncoder.decode("xxxx",“utf-8")将16进制字符转为中文。

这种方式需要注意的是,在使用encode转码后,会出现特殊字符,这时候,就需要将特殊字符替换为相应的16进制。因为特殊字符在url路径中做为参数传递时,也是乱码。

第二种:

传参前:encodeURI(“xxxx”)  。

接收参数后:使用java.net.URLDncoder.decode("xxxx",“utf-8")将16进制字符转为中文。

这种方式需要注意的是,在使用encodeURI转码后,会出现特殊字符,这时候,就需要将特殊字符也转码,所以使用两次encodeURI,即:

encodeURI(encodeURI(“xxxx”))。

这两种转码方式是很好用的,所以很建议大家使用。

3. 修改tomcat配置文件:

在Tomcat的安装目录下conf文件夹中的server.xml文件,将配置访问端口的地方加上URIEncoding=“utf8"即可。  <Connector port="8080" maxThreads="150" minSpareThreads="25" maxSpareThreads="75" URIEncoding="GBK">

 

最后介绍下字符集:

主要的字符编码又三种
1、Default(GB2312、GBK)
一个汉字两个字节,一个字母一个字节,缺点就是会和其他编码冲突,没有国际通用性。
2、Unicode
任何一个字符都是两字节,具有国际通用性,但html传输中多数字符是字母,造成大量带宽浪费。
3、Utf8(UCS transformation formats)
一个汉字三个字节,一个字母一个字节
这个是Unicode的升级版。 

转载于:https://my.oschina.net/u/2331760/blog/710167

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值