关于XMLHTTP对象返回编码问题的各种方法整理

最新推荐文章于 2023-04-18 17:00:54 发布

xpnew

最新推荐文章于 2023-04-18 17:00:54 发布

阅读量3.8k

点赞数

文章标签： xmlhttprequest vbscript function firefox header null

本文链接：https://blog.csdn.net/xpnew/article/details/1502053

版权

第一种，我原先的办法。
在服务器端加上UTF-8编码说明：

< %@LANGUAGE = " VBSCRIPT " CODEPAGE = " 65001 " % >

< % Response.Charset = " UTF-8 " % >

< % ' Response.CodePage=65001%>

其中上述代码中的第三行，被我加了注释。这是由于，在2003所带的IIS6当中，不支持这条命令。所以麻烦就来了：在本地用XP调试程序，就得把这条注释去掉，在上传到2003服务器上之前还得再把注释加上。

第二种：直接在服务器端加上GB2312的编码说明，但是经过我的测试（本机XP sp2 中文版），未通过。但是我也把它记录下来，也许哪天还能用得上。

PHP:header('Content-Type:text/html;charset=GB2312');
ASP:Response.Charset("GB2312")
JSP:response.setHeader("Charset","GB2312");

第三种：使用自定义函数进行编码转换。

方法一:

function gb2utf8(data) {

var glbEncode = [];

gb2utf8_data = data;

execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript");

var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2");

t=t.split("@");

var i=0,j=t.length,k;

while(++i<j) {

k=t[i].substring(0,4);

if(!glbEncode[k])

{

gb2utf8_char = eval("0x"+k);

execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript");

glbEncode[k]=escape(gb2utf8_char).substring(1,6);

}

t[i]=glbEncode[k]+t[i].substring(4);

}

gb2utf8_data = gb2utf8_char = null;

return unescape(t.join("%"));

}

使用时:xxx.innerHTML=gb2utf8(req.responseBody);

方法二.

Function bytes2BSTR_GB2312(vIn)

strReturn = ""

For i = 1 To LenB(vIn)

ThisCharCode = AscB(MidB(vIn,i, 1 ))

If ThisCharCode < & H80 Then

strReturn = strReturn & Chr (ThisCharCode)

Else

NextCharCode = AscB(MidB(vIn,i + 1 , 1 ))

strReturn = strReturn & Chr ( CLng (ThisCharCode) * & H100 + CInt (NextCharCode))

i = i + 1

End If

bytes2BSTR_GB2312 = strReturn

End Function

方法三:

< script language = " JavaScript " >

<!--

function utf8(wide) {

var c, s;

var enc = "";

var i = 0;

while(i<wide.length) {

c= wide.charCodeAt(i++);

// handle UTF-16 surrogates

if (c>=0xDC00 && c<0xE000) continue;

if (c>=0xD800 && c<0xDC00) {

if (i>=wide.length) continue;

s= wide.charCodeAt(i++);

if (s<0xDC00 || c>=0xDE00) continue;

c= ((c-0xD800)<<10)+(s-0xDC00)+0x10000;

}

// output value

if (c<0x80) enc += String.fromCharCode(c);

else if (c<0x800) enc += String.fromCharCode(0xC0+(c>>6),0x80+(c&0x3F));

else if (c<0x10000) enc += String.fromCharCode(0xE0+(c>>12),0x80+(c>>6&0x3F),0x80+(c&0x3F));

else enc += String.fromCharCode(0xF0+(c>>18),0x80+(c>>12&0x3F),0x80+(c>>6&0x3F),0x80+(c&0x3F));

}

return enc;

}

var hexchars = " 0123456789ABCDEF " ;

function toHex(n) {

return hexchars.charAt(n>>4)+hexchars.charAt(n & 0xF);

}

var okURIchars = " ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789_- " ;

function encodeURIComponentNew(s) {

var s = utf8(s);

var c;

var enc = "";

for (var i= 0; i<s.length; i++) {

if (okURIchars.indexOf(s.charAt(i))==-1)

enc += "%"+toHex(s.charCodeAt(i));

else

enc += s.charAt(i);

}

return enc;

}

alert(encodeURIComponentNew( " 中文 " ))

alert(decodeURIComponent(encodeURIComponentNew( " 中文 " )))

// -->

</ script >

第四种：在发送请求的时候提供编码，这种办法需要区分浏览器，所以我没有测试和采纳。但是也把它给摘录下来。（源文地址：http://blog.csdn.net/bailove/archive/2006/05/26/756365.aspx）

XMLHttpRequest读取中文网页时返回乱码的解决办法

XMLHttpRequest 默认是用UTF-8 传递数据。当服务端的返回数据是UTF-8编码的时候，它工作得很好(开发web应用，当服务端和客户端以及数据库统一使用UTF-8编码可以有效的避免乱码问题)。如果服务端设置了正确的Content-Type Response Header以及编码信息，那么XmlHttpRequest也可以正确工作。

可是当使用XMLHttpRequest读取中文网页内容时，如果服务端的程序没有设置Content-Type Response Header，或者Header没有设置编码类型，那么我们访问responseText属性的时候就可能遭遇乱码。如以下代码用XMLHttpRequest获取雅虎中国网站的星座站首页:

xmlhttp = getXMLHttpRequest();var url = "http://cn.astrology.yahoo.com/";xmlhttp.open("GET", url, true);xmlhttp.onreadystatechange = function(){if (xmlhttp.readyState == 4)    if (xmlhttp.status == 200)        alert(xmlhttp.responseText);};xmlhttp.send(null);

纵使yahoo中国这样专业的网站，对web标准的支持还很不彻底，弹出的html源码中充斥不符合web标准的html标签，当然还有已预见的乱码。

同样遗憾的是，FireFox 和 IE 的解决方法也是南辕北辙

FireFox

FireFox 的XMLHttpRequest对象支持overrideMimeType方法，可以指定返回数据的编码类型，利用该方法可以解决中文乱码，前面的代码修改如下：

xmlhttp = getXMLHttpRequest();var url = "http://cn.astrology.yahoo.com/";xmlhttp.open("GET", url, true);xmlhttp.overrideMimeType("text/html;charset=gb2312");//设定以gb2312编码识别数据xmlhttp.onreadystatechange = function(){if (xmlhttp.readyState == 4)    if (xmlhttp.status == 200)        alert(xmlhttp.responseText);};xmlhttp.send(null);

Internet Explorer

IE不支持overrideMimeType方法，并且只能用一种很蹩脚的方法来解决，此时需要引入一个杂交的函数：

function gb2utf8(data){	var glbEncode = [];	gb2utf8_data = data;	execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript");	var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2");	t=t.split("@");	var i=0,j=t.length,k;	while(++i<j) {		k=t[i].substring(0,4);		if(!glbEncode[k]) {			gb2utf8_char = eval("0x"+k);			execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript");			glbEncode[k]=escape(gb2utf8_char).substring(1,6);		}		t[i]=glbEncode[k]+t[i].substring(4);	}	gb2utf8_data = gb2utf8_char = null;	return unescape(t.join("%"));}xmlhttp = getXMLHttpRequest();var url = "http://cn.astrology.yahoo.com/";xmlhttp.open("GET", url, true);xmlhttp.onreadystatechange = function(){if (xmlhttp.readyState == 4)    if (xmlhttp.status == 200)        alert(gb2utf8(xmlhttp.responseBody)); //注意这里要用responseBody};xmlhttp.send(null);