关于XMLHTTP客户端与ASP交互传输XML时所产生的中文编码问题的解决方案

原创 2006年05月18日 21:24:00

测试通过系统:WinXP 中文Pro, XML4.0 SP2,C#

  尝试过XMLHTTP作客户端,然后尝试与服务器端ASP交互的程序员,我认为都很有思路,当然这也是在自夸:)。但最头疼的问题恐怕就是中文乱码的问题,查了很多资料,MSDN,互联网上的,尝试了很多方法都不太奏效,还好没有气馁,现在,最新的最简单的解决办法闪亮登场:

把客户端要传输的XML的头由:

<?xml version="1.0" encoding="gb2312" ?>

改为:

<?xml version="1.0" encoding="utf-8" ?>

服务器端的ASP程序发送给客户端XML结果时需要加:

Response.ContentType = "text/xml"
Response.CharSet = "gb2312"

客户端的程序取返回结果用XmlDom.loadXml(xmlhttp.responseText)就可以了。

 ============================================================================

以下分析可能的原因:

可能是我们的操作系统本身使用UTF-8编码的原因。

把所有Request.ServerVariables写到一个文本文件中你会发现类似这些:

ALL_HTTP:HTTP_ACCEPT:*/*
HTTP_ACCEPT_LANGUAGE:zh-cn
HTTP_CONNECTION:Keep-Alive
HTTP_HOST:localhost
HTTP_USER_AGENT:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727; InfoPath.1)
HTTP_COOKIE:ASPSESSIONIDAQBCSQRA=FNEHNOCCMHECCOPIOKKECEFM
HTTP_CONTENT_LENGTH:94
HTTP_CONTENT_TYPE:text/xml;charset=gb2312
HTTP_ACCEPT_ENCODING:gzip, deflate
HTTP_CACHE_CONTROL:no-cache

ALL_RAW:Accept: */*
Accept-Language: zh-cn
Connection: Keep-Alive
Host: localhost
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727; InfoPath.1)
Cookie: ASPSESSIONIDAQBCSQRA=FNEHNOCCMHECCOPIOKKECEFM
Content-Length: 94
Content-Type: text/xml;charset=gb2312
Accept-Encoding: gzip, deflate
Cache-Control: no-cache

APPL_MD_PATH:/LM/W3SVC/1/Root/zdqs
APPL_PHYSICAL_PATH:C:/Inetpub/systems/ZDS/qry/
AUTH_PASSWORD:
AUTH_TYPE:
AUTH_USER:
CERT_COOKIE:
CERT_FLAGS:
CERT_ISSUER:
CERT_KEYSIZE:
CERT_SECRETKEYSIZE:
CERT_SERIALNUMBER:
CERT_SERVER_ISSUER:
CERT_SERVER_SUBJECT:
CERT_SUBJECT:
CONTENT_LENGTH:94
CONTENT_TYPE:text/xml;charset=gb2312
GATEWAY_INTERFACE:CGI/1.1
HTTPS:off
HTTPS_KEYSIZE:
HTTPS_SECRETKEYSIZE:
HTTPS_SERVER_ISSUER:
HTTPS_SERVER_SUBJECT:
INSTANCE_ID:1
INSTANCE_META_PATH:/LM/W3SVC/1
LOCAL_ADDR:127.0.0.1
LOGON_USER:
PATH_INFO:/zdqs/QURY.asp
PATH_TRANSLATED:C:/Inetpub/systems/ZDS/qry/QURY.asp
QUERY_STRING:
REMOTE_ADDR:127.0.0.1
REMOTE_HOST:127.0.0.1
REMOTE_USER:
REQUEST_METHOD:POST
SCRIPT_NAME:/zdqs/QURY.asp
SERVER_NAME:localhost
SERVER_PORT:80
SERVER_PORT_SECURE:0
SERVER_PROTOCOL:HTTP/1.1
SERVER_SOFTWARE:Microsoft-IIS/5.1
URL:/zdqs/QURY.asp
HTTP_ACCEPT:*/*
HTTP_ACCEPT_LANGUAGE:zh-cn
HTTP_CONNECTION:Keep-Alive
HTTP_HOST:localhost
HTTP_USER_AGENT:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727; InfoPath.1)
HTTP_COOKIE:ASPSESSIONIDAQBCSQRA=FNEHNOCCMHECCOPIOKKECEFM
HTTP_CONTENT_LENGTH:94
HTTP_CONTENT_TYPE:text/xml;charset=gb2312
HTTP_ACCEPT_ENCODING:gzip, deflate
HTTP_CACHE_CONTROL:no-cache

猜测一:网络传输过程中所用的编码方式是gb2312

然后,请看另外MSXML4 SDK中一个帮助:

 

Enforcing Character Encoding with DOM

In some cases, an XML document is passed to and processed by an application—for example, an ASP page—that cannot properly decode rare or new characters. When this happens, you might be able to work around the problem by relying on DOM to handle the character encoding. This bypasses the incapable application.

For example, the following XML document contains the character entity ("&#8364;") that corresponds to the Euro currency symbol (). The ASP page, incapable.asp, cannot process currency.xml.

XML Data (currency.xml)

<?xml version="1.0" encoding="utf-8"?>
<currency>
   <name>Euro</name>
   <symbol>&#8364;</symbol>
   <exchange>
      <base>US___FCKpd___0lt;/base>
      <rate>1.106</rate>
   </exchange>
</currency>

ASP Page (incapable.asp)

<%@language = "javascript"%>
<%
   var doc = new ActiveXObject("Msxml2.DOMDocument.4.0");
   doc.async = false;
   if (doc.load(Server.MapPath("currency.xml"))==true) {
      Response.ContentType = "text/xml";
      Response.Write(doc.xml);
   }
%>

When incapable.asp is opened from a Web browser, an error such as the following results:

An invalid character was found in text content. Error processing resource 'http://MyWebServer/MyVirtualDirectory/incapable.asp'. Line 4, Position 10

This error is caused by the use of the Response.Write(doc.xml) instruction in the incapable.asp code. Because it calls upon ASP to encode/decode the Euro currency symbol character found in currency.xml, it fails.

However, you can fix this error. To do so, replace this Response.Write(doc.xml) instruction in incapable.asp with the following line:

doc.save(Response);

With this line, the error does not occur. The ASP code does produce the correct output in a Web browser, as follows:

  <?xml version="1.0" encoding="utf-8" ?> 
  <currency>
    <name>Euro</name> 
    <symbol></symbol> 
    <exchange>
      <base>US$</base> 
      <rate>1.106</rate> 
    </exchange>
  </currency>

The effect of the change in the ASP page is to let the DOM object (doc)—instead of the Response object on the ASP page—handle the character encoding.

请看最后一句:上例中ASP的改变在于让DOM对象(doc)——而不是ASP中的Response对象——处理字符编码。

所以得出:

猜想二:你可以视Request或Response对象为一个文件句柄,如果是用DOM对象的load与save方法时。

由猜想一、猜想二得出

猜想三:客户端编译的系统使用的字符串本身就是采用GB2312编码的,而使用XMLHTTP传输数据时自动转换为GB2312,服务器端用DOM对象load时由于相当于载入一个字节流,然后一看xml头中的encoding就是GB2312,所以就没做转换,直接把字节流视为字符串!!!不好意思是它的确忘记了一件事就是,这个字符串在我的系统显示时却认为是UTF-8编码的,所以只有强制xml转换以下就行了,好像见别人的解决方案时也有写gb2312到utf-8转换函数的……

最后实践,证实可行!!!

用一句话概括就是,客户端发送给服务器的XML,encoding全部为utf-8编码的;服务器发送给客户端,全部指定编码为:gb2312,一切OK。

ASP模拟POST提交,然后XMLHTTP获取数据总是乱码,请大家帮忙,感谢!

目前在建的一个项目要求使用外部的一个网站达到切词的目的,由于外部网站的API接口要求必须是POST提交数据,因此只能模拟POST提交,然后再去读取提交后的数据,我用以下的代码,获取回来的中文总是乱码,...
  • lishimin1012
  • lishimin1012
  • 2017年03月06日 22:18
  • 550

中文数据网络传输转码与解码过程浅析

网络中传输数据,尤其是中文必然会遇到,转码与解码过程,中文产生乱码问题也就发生在该过程的某一环节,下面我将用代码的方式模拟整个转码和解码过程,相信理解此文之后,对所有中文乱码都会找到原因并处理之。在此...
  • zmx729618
  • zmx729618
  • 2016年07月04日 17:50
  • 1098

Socket通讯简单实现,乱码问题

手机端 SocektThread.java package com.pxx; import java.io.BufferedReader; import java.io.InputStreamRea...
  • xiaoxiao54562
  • xiaoxiao54562
  • 2014年03月20日 10:09
  • 4917

myeclipse修改文件编码问题---乱码解决方法

应该是中文操作系统的原因,eclipse默认的新项目的编码是GBK,出于对编码支持的考虑,项目组中最好统一要求是UTF-8编码进行开发。     修改eclipse的配置,可以使得eclipse...
  • shanzhizi
  • shanzhizi
  • 2013年05月31日 22:12
  • 1488

asp对中文编码及解码,Decode和Encode中文网址处理

'============================================================== '功能:ASP Server对象内置编码函数 '描述:没有对应的解码...
  • SJian123
  • SJian123
  • 2014年10月16日 16:54
  • 3842

【ASP】从URL获取中文字符然后查找数据库后输出GBK中文

昨天项目中遇到了些困难,研究了一下午终于搞定了。 事情是这样的:我们的客户端需要...
  • u011156012
  • u011156012
  • 2014年11月18日 10:33
  • 958

XML文件的编码问题

这两天在项目处理一个解析编码格式为ANSI的xml文件时,遇到了一些问题,现将分析过程总结如下。 通过win7自带的记事本或者notepad++创建一个xml文件test_source: co...
  • u010832643
  • u010832643
  • 2014年06月06日 00:50
  • 4057

asp.net中URL参数传值中文乱码的三种解决办法

在做Asp.Net开发的时候,参数传递中文时,经常会遇到页面乱码的问题,下面是在网上收集的相关资料,请大家参考: 解决的方法一般有3种: 1.设置web.config文件 ....
  • lijian260
  • lijian260
  • 2015年10月15日 10:15
  • 2360

XML乱码问题和encoding的理解

文件编码也称为字符编码,用于指定在处理文本时如何表示字符。一种编码可能优于另一种编码主要取决于它能处理或不能处理哪些语言字符,不过通常首选的是 Unicode。读取或写入文件时,未正确匹配文件编码的情...
  • sxh850297968
  • sxh850297968
  • 2014年11月21日 16:59
  • 5426

dom4j生成xml文件,解析后出现中文乱码问题

背景(可以忽略)项目在本地写完了,和队友测试都通过了,最后部署到云端,云端服务器是Windows Server 2008 R2 Standard操作系统,部署到云端后再次和队友测试一下,就出现了问题。...
  • zl594389970
  • zl594389970
  • 2016年11月26日 18:51
  • 2011
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:关于XMLHTTP客户端与ASP交互传输XML时所产生的中文编码问题的解决方案
举报原因:
原因补充:

(最多只允许输入30个字)