一、乱码原因
1.web容器的默认编码格式大都是iso-8859-1(jetty好像是utf-8),单字节编码转换不会破坏原有数据格式,url在网络传输中会按urlEncode编码的.进入容器会对url及其参数进行解码。
2.请求进入->容器处理(connector)->过滤器->servlet(utf8->gbk->utf8 奇数个数中文会尾部乱码),原因:gbk中文2字节,utf8是3字节,如果是3个中文,奇数个字节是9转gbk不够,会补足,按照gbk码表变成10个字节,被破坏格式了。再转utf-8格式,前面2个格式未变转码成功,最后一个格式不对,就乱码
二、解决方法
1.Post请求 如果是servlert的话 要在处理请求参数前 加request. setCharacterEncoding(charset) ,request处理参数就会对
param按照设定的charset编码格式转换。如果已经处理过参数,request其实对参数已经经过编码处理,不同编码出现乱码问题。(java在处理请求的时候会默认用java文件编码格式处理)
2.get请求可能需要自己对参数进行转码处理。 如果uri里面有中文的话,这个比较麻烦,可以取值然后挨个转码。如果utf8->gbk转过的话,基本数据格式就破坏了,所以要在这个之前设置处理。