java.net.URLEncoder 与 java.net.URLDecoder.decode
java.net.URLEncoder
URLEncoder是用来对HTML表单编码,该类包含用于将字符串转换为application/x-www-form-urlencoded 格式的静态方法。 (application/x-www-form-urlencoded: 数据被编码为名/值对)
当发出get请求时,浏览器用x-www-form-urlencoded的编码方式把form数据转换成一个字串(name1=value1&name2=value2…),然后把这个字串以请求参数形式附加到url后面。当发出post请求时,浏览器把form数据封装到http body中,然后发送到server。
URLEncoder编码时遵循的规则
a-z,A-Z,0-9保持原样。
特殊字符.,-,*与_保持原样。
空格被转换为+号。
其它字符转换为%xy的形式,xy由16进制数来表示。
import java.io.UnsupportedEncodingException;
import java.net.URLEncoder;
public class Main {
public static void main(String[] args) throws InterruptedException, ExecutionException {
try {
String string = "The string ü@foo-bar";
String encodedString = URLEncoder.encode(string, "UTF-8");
System.out.println("Encoded String: " + encodedString);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
}
}
上述代码[1]使用UTF-8编码。The string ü@foo-bar被转换为The+string+%C3%BC%40foo-bar因为UTF-8,ü被编码为两字节C3(16进制),BC(16进制),@被编码为一字节40(16进制)。
java.net.URLDecoder
public class Main {
public static void main(String[] args) throws UnsupportedEncodingException {
System.out.println(URLDecoder.decode("special+chars%3A+%26%25*+", "UTF-8"));
}
}
上面代码[2]解码使用UTF-8的格式,最终输出:
special chars: &%*
解码可总结为:
1.对读入的字符串逐个遍历各个字符
2.如果读入字符是+号,则转换为空格,如果不是以%号开头则不进行转换,直接返回。
3.如果以%号开头
3.1预分配缓冲区,大小为最大可能剩余字符数
转载链接:转载请标明出处 原文链接:https://blog.csdn.net/revivedsun/article/details/69186652