据不可靠消息JavaScript是用Unicode UTF-8作为内码的,但是在目前混乱的浏览器环境中各种错误都有,特别是加入了更加混乱的AJAX后。
一类是出现乱码,
另外一类是出现javascript系统错误:-1072896658的。提示在XX.innerHTML=xmlhttp.responseText;这行。
其实都是因为编码不统一引起的。
解决方法就是加入指定字符编码指令。
一、什么是字符编码
定义见:http://zh.wikipedia.org/wiki/%E5%AD%97%E7%AC%A6%E7%BC%96%E7%A0%81。
通俗的讲:你看到的“我”是一张小图片,每个汉字都是,他对应一个编码4650,这些图片都存放在一个叫做字库的地方,你在字库中找到4650号图片,就是“我”了,其实字库就是windows的字体,宋体字库、雅黑字库等等等,一篇文章,你可以用宋体、仿宋体,不论用那种,“我”的对应的编码是不变的。你可以换字体,显示出来的“我”字体不同,但是还是一个“我”字。
二、问题的产生。
编码就有编码格式因此就产生了各种编码,汉字典型的有GB2312简体的,BIG5繁体的,Unicode繁简都有的。这里就产生问题了,在GB2312中4650是“我”,在Unicode中是6211。4650在Unicode中对应的是“䙐”。
因此,你在服务器的asp,jsp中用GB2312编码发送了“我”,到了浏览器,浏览器以为是Unicode,翻译出来就是“䙐”。这就是乱码了。
注意:本文中的Unicode仅以UTF-8为例。UTF-8定义传送门:http://zh.wikipedia.org/zh/UTF-8
三、解决思路。
当中还要注意一点:据不可靠消息JavaScript是用Unicode UTF-8作为内码的。
因此,如果使用Ajax,最好呈现页面也指定编码为UTF-8,省的转换了。统一了编码,自然就没有了乱码。
四、具体方法。
对于服务端脚本,在脚本开头:
PHP:header('Content-Type:text/html;charset=UTF-8');
ASP:Response.Charset="UTF-8"
JSP:response.setHeader("Charset","UTF-8");
注意ASP,很多地方是Response.Charset("UTF-8"),这是不正确的,Charset是属性不是方法,误导了很多人。
对于HTML
<head>
<meta name="description" content="Free Web tutorials" />
<meta name="keywords" content="HTML,CSS,XML,JavaScript" />
<meta name="author" content="Hege Refsnes" />
<meta http-equiv="content-type" content="text/html;charset=UTF-8" />
</head>
charset=编码名称。
对于<script>
<scripte type="text/javascript" charset="UTF-8">
但是,在实际应用中,特别是页面转换时,会出现前一个页面是UTF-8的,后面页面突然跳到了GB2312,然后乱码了,怎么办?
在服务器asp(PHP,JSP自行查方法)脚本开头中写入
Session.CodePage=65001
保持在这个Session中一直是UTF-8。
如果你想统一成GB2312,那么记得把上面的UTF-8换成GB2312,65001换成936。
这三部完成,基本可以解决乱码问题。