目录
1 什么是编码解码?
编码:是把字符转化为字节数组。
解码:是把字节数组转化为字符。
2 Url 编码解码过程?
但有一种特殊的 Url 编码方式是把字符转化为字符,具体的规则是:
如果字符是西文字符,则不对字符进行编码,如果字符是非西文字符或者特殊的西文符号(=,空格等),则把字符编码为多组 %xx 的形式,如 utf-8 编码的'蛋'字符的 Url 编码为 %E8%9B%8B。
3 Java 进行 Url 编码解码
URLEncoder.encode("蛋", "utf-8");// %E8%9B%8B//进行编码
URLDecoder.decode("%E8%9B%8B", "utf-8"); // 蛋 //进行解码
用途 : 经过 Url 编码的字符不含非西文字符和某些特殊的西文字符 , 方便进行网络传输。
4 Java URL 编码解码代码示例
import java.net.URLDecoder;
import java.net.URLEncoder;
/*模拟URL编码,解码的过程。以汉字“蛋”示例。*/
public class EncodeAndDecodeTest
{/*
* [-24, -101, -117] 这是三个字节
* 在utf-8编码表里 -24, -101, -117 ----------- 蛋
* 在ISO-8859-1里 -24, -101, -117 ----------- è
* 在url编码中 -24, -101, -117 ----------- %E8%9B%8B
*
* URLEncoder.encode("蛋", "utf-8");// %E8%9B%8B
* URLDecoder.decode("%E8%9B%8B", "utf-8"); // 蛋
*
* URLEncoder.encode("è", "ISO-8859-1");// %E8%9B%8B
* URLDecoder.decode("%E8%9B%8B", "ISO-8859-1"); // è
*/
public static void main(String[] args) throws Exception
{
// 1 用户在表单项中输入字符“蛋”,并且点击了提交按钮。
/* 如:表单中的用户名,密码等信息,提交后,都要拼接到URL中。 */
String s1 = "蛋";// “UTF-8”
// 2 浏览器把"蛋"字,进行了URL编码;转换成了对应的另一种字符表示。
// 蛋 -------> %E8%9B%8B
String s2 = URLEncoder.encode(s1, "UTF-8");
// 3 浏览器把URL 编码后的数据进行再次转换,转换为字节数组
// %E8%9B%8B-------> [37, 69, 56, 37, 57, 66, 37, 56, 66]
byte[] bytes1 = s2.getBytes("UTF-8");
// 4 浏览器把字节数组发送给服务器,服务器接收这些字节数组
byte[] bytes2 = bytes1;// [37, 69, 56, 37, 57, 66, 37, 56, 66]
// 5 服务器再把字节数组解码为字符串
// [37, 69, 56, 37, 57, 66, 37, 56, 66] -->%E8%9B%8B
String s3 = new String(bytes2, "UTF-8");
// 6 和第 2 步是逆过程,进行解码
// %E8%9B%8B -->蛋
String s4 = URLDecoder.decode(s3, "UTF-8");
// 进一步思考?
// 当我们调用 request.getParameter(arg)方法时,为什么会乱码呢?
// 实际上 服务器端,解码错误了。
// è -------->[-24, -101, -117] 才会出现乱码,显示字符“è ”
String s5 = URLDecoder.decode(s3, "ISO-8859-1");// 使用了“ISO-8859-1”进行了解码
// 再进一步思考?
// 怎么解决这个错误呢?
// 思路:把字符,转换到其最原始的 字节数组,再重新进行解码?
// <1>获得字节数组
// è -------->[-24, -101, -117]
byte[] bytes3 = s5.getBytes("ISO-8859-1");// [-24, -101, -117]
// <2>重新解码
String s6 = new String(bytes3, "UTF-8");//
System.out.println(s6);// 蛋
}
}