Java 程序使用的是统一码(Unicode),从字节流中读取一个字符时,返回该字符的统一码。字符在字节流中的编码可能不是统一码,Java自动地将它转化为统一码
当提交表单的时候,浏览器的编码方式取决于当前页面的编码设定,对Form标签也照此处理,这意味着如果ASCII格式的HTML页面用ISO-8859-1编码,那么用户在此页面中将不能提交中文字符。所以,如果你的页面使用的是 utf-8,那么 POST 的时候,也将使用 utf-8 。
由于 Tomcat 是美国人设计的,Tomcat 默认使用ISO8859-1 编码对客户端返回的内容进行解码,由于编码与内容不一致,就会出现乱码的出现,根据以上的分析,在服务器端读取客户端回送的内容时,需要进行编码转换
String wrongName = resquest.getParameter(“name”);
String rightName = new String(wrongName.getBytes(“ISO8859_1”), GB2312”);
编码转换过程:
wrongName(将——按ISO8859_1解码的错误字符串,按照Unicode编码表得到的字节数组对应的Java字符串)
Unicode
按ISO8859_1解码的错误字符串
ISO8859_1
字节流
GB2312
按GB2312解码的正确字符串
Unicode
rightName(将——按GB2312解码的正确字符串,按照Unicode编码表得到的字节数组对应的Java字符串)