2.http协议不会对请求参数进行编解码!!!!只是传输,传输的是二进制,无所谓什么编码解码,http是机器之间通讯,为什么要编码解码?机器认得字符?机器只认二进制。解码是tomcat的工作,utf8编码的字节序列被tomcat默认以iso8895-1方式解码所以有了乱码,所以要重新编码再解码。
对于URL中的中文参数,浏览器(IE除外)会对中文进行urlencode,转为16进制进行传输,tomcat不会再对数据进行编码,只会解码,默认按照8859-1进行解码,然后通过.getBytes("8859-1")编码(还原传递过来的16进制数组),再通过UTF8解码。流程就是:tomcat解码--》自行编码(还原)--》解码(utf8)
浏览器使用的是UTF-8字符集,传输的时候把字符用utf-8编码变成字节码。Tomcat服务器默认是使用的是IS0-8859-1字符集,所以会把浏览器传过来的用utf-8编码的字节码使用IS0-8859-1字符集解码,因为编码跟解码使用的字符集不一致才导致乱码的
post请求方式的参数是在请求体中
request.setCharacterEncoding("UTF-8"); //命令Tomcat使用UTF-8码表解码,而不用默认的ISO-8859-1了。
get请求和post请求方式的中文乱码问题处理方式不同
get:
new String(xxx.getBytes("ISO-8859-1"),"UTF-8");
post:请求参数在请求体中,使用servlet API解决乱码问题,其原理就是一次编码一次解码,命令tomcat使用特定的码表解码。
request.setCharaterEncoding("UTF-8");