GET请求中的中文没有URL编码,所以可能会丢失一些字节
POST表单默认使用URL编码,服务器会自动识别URL编码并自动调用URLDecoder进行解码
首先进行字符编码,然后在字符编码之上进行URL编码
原理代码:
public class Test3 {
public static void main(String[] args) throws UnsupportedEncodingException {
String name = "王越";
byte[] b = name.getBytes("utf-8");
System.out.println(Arrays.toString(b));
// %E7 %8E %8B %E8 %B6 %8A
// String s = URLEncoder.encode(name,"UTF-8");
// System.out.println(s);
}
}
按照utf-8编码的结果:
手动按照规则转换成URL编码的结果是: %E7 %8E %8B %E8 %B6 %8A
直接使用URL编码程序如下:
public class Test3 {
public static void main(String[] args) throws UnsupportedEncodingException {
String name = "王越";
// byte[] b = name.getBytes("utf-8");
// System.out.println(Arrays.toString(b));
// %E7 %8E %8B %E8 %B6 %8A
String s = URLEncoder.encode(name,"UTF-8");
System.out.println(s);
}
}
可以看到这两个程序的输出是一样的:
所以总的来说当给URLEncoder.encode(name,"UTF-8");
传递一个编码的字符集,则
- 首先按照字符集进行编码
- 按照URL编码的规则:将第一步中的数+256,再转换成16进制后前面+%
服务器端的解码
服务器端会自动识别URL编码,在调用request.getParameter()
方法之前就自动进行了URL的解码。
表单中数据会自动进行编码,但是超链接中的中文在后期需要自己进行编码!(使用jsp)但是在链接中尽量少写中文