中文乱码原因:生成字节流的编码规则和转换字符流的编码规则不一致造成。
避免和解决中文乱码的方法为:统一编码方式。
下面介绍解决浏览器中中文乱码的方法:
1.保证请求对象,服务器容器,发送对象请求,获取,发送数据时的编码方式一致,如,请求数据用utf-8,接收数据也用utf-8,发送数据也用utf-8。
2.在客户端指定发送数据时两次encodeUrl,服务器端decodeUrl一次。
HttpServletRequest HttpServletResponse设置请求头或者响应头来控制servlet容器或者浏览器以什么样的编码方式,解析字节流到字符流。
实例:
response.setHeader("Content-Type","text/html;charset=UTF-8");
String data ="一串中文";
OutputStream os = response.getOutputStream();
os.write(data.getBytes("UTF-8"));
javascript 常用的编码格式:escape(), encodeURL(), encodeURIComponent()
escape() 方法:
采用ISO Latin字符集对指定的字符串进行编码。所有的空格符、标点符号、特殊字符以及其他非ASCII字符都将被转化成%xx格式的字符编码(xx等于该字符在字符集表里面的编码的16进制数字)。比如,空格符对应的编码是%20。不会被此方法编码的字符: @ * / +
encodeURI() 方法:
把URI字符串采用UTF-8编码格式转化成escape格式的字符串。不会被此方法编码的字符:! @ # $& * ( ) = : / ; ? + '
encodeURIComponent() 方法:
把URI字符串采用UTF-8编码格式转化成escape格式的字符串。与encodeURI()相比,这个方法将对更多的字符进行编码,比如 / 等字符。所以如果字符串里面包含了URI的几个部分的话,不能用这个方法来进行编码,否则 / 字符被编码之后URL将显示错误。不会被此方法编码的字符:! * ( ) '因此,对于中文字符串来说,如果不希望把字符串编码格式转化成UTF-8格式的(比如原页面和目标页面的charset是一致的时候),只需要使用escape。如果你的页面是GB2312或者其他的编码,而接受参数的页面是UTF-8编码的,就要采用encodeURI或者encodeURIComponent。另外,encodeURI/encodeURIComponent是在javascript1.5之后引进的,escape则在javascript1.0版本就有。
<title> url字符串的加密与解密 </title>
<script language="JavaScript">
var str="http://hi.baidu.com/bbjjss2008l?country=中国&name=jz";
var urlStr=escape(str);
document.write("escape方法加密:<br>"+urlStr+"<br>解密后url字符串是:<br>"+unescape(str));
urlStr=encodeURI(str);
document.write("<br>encodeURI:方法加密:<br>"+urlStr+"<br>解密后url字符串是:<br>"+decodeURI(str));
urlStr=encodeURIComponent(str);
document.write("<br>encodeURIComponent:方法加密:<br>"+urlStr+"<br>解密后url字符串是:<br>"+decodeURIComponent(str));
</script>