XMLHttp读取GB2312编码的网页

曲同学昨天问我一XMLHttp读取显示中文的问题,今天找了下资料。
折腾了一下午,才搞定,记下。

问题是这样的:
用XMLHttp读取别人的网页,由于国内很多人把网页的编码设为GB2312,或其
他不与UTF-8兼容的编码方式,而XMLHttp的默认编码方式为UTF-8,导致读取的
中文内容不能正常被显示。

解决:
写一转码函数,先对读出的内容进行转码,然后再进行显示或者其他处理。
网上多数解决方案是VBScript实现的,唯一一套JAVAScript的函数,也调用了VB的处理,
好像是因为JAVAScript里没有实现字符和内码的转换。
这里有一点问题,转码responseBody的时候,没有问题,
但是转码responseText的时候却报了脚本错误。可能因为responseText作为网页返回的
信息,里面有个别的字符的转码有问题。
这里用的是responseBody,因为responseBody是未解码的二进制数据,而responseText是
解码后的字符串,而xmlhttp默认解码方式为utf-8字符集,对于没有指定返回数据编码的页面,
就会出现中文解码为乱码的情况。指定返回编码的方法:
PHP:header('Content-Type:text/html;charset=GB2312');
ASP:response.Charset="GB2312"
JSP:response.setHeader("Charset","GB2312");
这样,responseText的数据中的中文应该就能正确解码了。
(还没有进行服务器端测试)
测试结果见后续篇

引申问题:
使用XMLHttpRequest来POST带有中文的数据到其他非UTF-8编码的动态页面时,也会有问题,还没解决,解决以后再写一篇。

测试环境为:Windows XP + IE6.0

测试代码:

< html >
    
< head >
        
< title ></ title >
        
< meta  http-equiv ="Content-Type"  content ="text/html; charset=gb2312" >
        
< script  language ="javascript" > ...
            
var xmlHttp;
            
//JavaScript转码函数
            function gb2utf8(data)...{
                
var glbEncode = [];
                gb2utf8_data 
= data;
                execScript(
"gb2utf8_data = MidB(gb2utf8_data, 1)""VBScript");
                
var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(....{2})(....{2})/g,"%$2%$1").replace(/%([A-Z].)%(....{2})/g,"@$1$2");
                t
=t.split("@");
                
var i=0,j=t.length,k;
                
while(++i<j) ...{
                    k
=t[i].substring(0,4);
                    
if(!glbEncode[k]) ...{
                        gb2utf8_char 
= eval("0x"+k);
                        execScript(
"gb2utf8_char = Chr(gb2utf8_char)""VBScript");
                        glbEncode[k]
=escape(gb2utf8_char).substring(1,6);
                    }

                    t[i]
=glbEncode[k]+t[i].substring(4);
                }

                gb2utf8_data 
= gb2utf8_char = null;
                
return unescape(t.join("%"));
            }

            
function CreateXmlHttp()
            ...
{
                
if(window.ActiveXObject)
                ...
{
                    xmlHttp 
= new ActiveXObject("Microsoft.XMLHTTP");
                }

                
else if(window.XMLHttpRequest)
                ...
{
                    xmlHttp 
= new XMLHttpRequest();
                }

            }

            
function startRequest()
            ...
{
                
var ipp = document.getElementById("ipbox").value;
                
//使用GET方法
                var url = "http://www.kiees.com/ip.asp?ip="+ipp;
                CreateXmlHttp();
                xmlHttp.onreadystatechange 
= handleStateChange;
                xmlHttp.open(
"GET",url,true);
                xmlHttp.send(
null);
                
                
//*************使用POST方法****************           
                //*****************************************
                //var url = "http://www.kiees.com/ip.asp";
                //var content="ip="+ipp;
                //CreateXmlHttp();
                //xmlHttp.onreadystatechange = handleStateChange;
                //xmlHttp.open("POST",url,true);
                //xmlHttp.setRequestHeader("Content-Length",content.length);
                //xmlHttp.setRequestHeader("Content-Type","application/x-www-form-urlencoded;");
                //xmlHttp.send(content);
                //*****************************************
            }

            
function handleStateChange()
            ...
{
                
if(xmlHttp.readyState == 4)
                ...
{
                    
if(xmlHttp.status == 200)
                    ...
{
                        
var rt = xmlHttp.responseBody;
                        
//使用JavaScript函数
                        document.getElementById("lt").innerText =gb2utf8(rt);
                        
                        
//*************使用VbScript函数****************  
                        
//*********************************************
                        //document.getElementById("lt").innerText =convertstr(rt);
                        //*********************************************
                    }

                }

            }

            
</ script >
            
< script  language ="VBScript" > ...
              
'VbScript转码函数
        Function convertstr(vIn) 
           strReturn 
= "" 
           
For i = 1 To LenB(vIn) 
           ThisCharCode 
= AscB(MidB(vIn,i,1)) 
           
If ThisCharCode < &H80 Then 
           strReturn 
= strReturn & Chr(ThisCharCode) 
           
Else 
           NextCharCode 
= AscB(MidB(vIn,i+1,1)) 
           strReturn 
= strReturn & Chr(CLng(ThisCharCode) * &H100 + CInt(NextCharCode)) 
           i 
= i + 1 
           
End If 
           
Next 
           convertstr 
= strReturn 
        
End Function 
      
</ script >
        
</ head >
        
< body >
            
< form >
                请输入IP:
< input  name ="ipbox"  id ="ipbox"  type ="text"  maxlength ="15"   />   < input  type ="button"  value ="查询"  onclick ="startRequest();" />
                
< div  id ="lt" >
                
</ div >
            
</ form >
        
</ body >
    
</ html >
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
### 回答1: VBA(Visual Basic for Applications)是一种编程语言,可以用于自动化处理和操作Office应用程序中的数据和功能。然而,由于金蝶云星辰网页版使用的是云平台,不同于本地的Office应用程序,所以无法直接通过VBA读取网页版的数据。 要读取金蝶云星辰网页版的数据,通常需借助其他编程工具和技术。一种常见的方法是使用Web请求和HTML解析库,如Python的Requests和BeautifulSoup等。 具体操作步骤如下: 1. 使用VBA编写一个辅助程序,例如在Excel或Access中创建一个宏(Macro)。 2. 在VBA辅助程序中,调用Python代码,通过执行Python脚本来读取金蝶云星辰网页版的数据。 3. 在Python中,使用Requests库发送HTTP请求,将金蝶云星辰网页版的网址作为URL参数。 4. 获取到网页的原始HTML响应后,再使用BeautifulSoup库解析HTML文档,提取所需的数据。 5. 将从网页中提取的数据传递回VBA辅助程序,可以通过各种方式进行进一步处理和分析,例如存储到Excel或Access中。 值得注意的是,以上方法只是一种示例,实际实现可能会因具体应用场景和技术选择而有所不同。要根据实际需求和技术要求的调整使用相应的编程工具和技术,以确保能够有效地读取金蝶云星辰网页版的数据。 ### 回答2: VBA(Visual Basic for Applications)是一种用于编写宏和自动化任务的编程语言,可以通过VBA来读取金蝶云星辰网页版的数据。下面是一种可以实现这个功能的思路: 首先,我们可以使用VBA中的“XMLHTTP”对象来发送HTTP请求,从网页版金蝶云星辰中获取数据。使用“XMLHTTP”对象需要引用“Microsoft XML, v6.0”(或更高版本)类库。 其次,我们需要使用VBA中的“Document”对象来解析返回的HTML文档。我们可以通过“getElementsByClassName”、“getElementByID”等方法来获取我们想要的元素或数据。 在实际的操作中,我们需要先创建一个新的工作簿,然后在VBA编辑器中编写代码来实现读取金蝶云星辰网页版的功能。下面是一个简单的示例代码: ```vba Sub ReadK3CloudWebPage() ' 创建XMLHTTP对象 Dim httpRequest As Object Set httpRequest = CreateObject("MSXML2.XMLHTTP.6.0") ' 发送HTTP请求 Dim url As String url = "http://website.com/data" httpRequest.Open "GET", url, False httpRequest.send ' 解析返回的HTML文档 Dim htmlDoc As Object Set htmlDoc = CreateObject("htmlfile") htmlDoc.body.innerHTML = httpRequest.responseText ' 获取指定元素的数据 Dim dataElement As Object Set dataElement = htmlDoc.getElementById("data_element_id") ' 输出数据到工作簿 Dim wb As Workbook Set wb = ThisWorkbook Dim ws As Worksheet Set ws = wb.Worksheets("Sheet1") ws.Range("A1").Value = dataElement.innerText End Sub ``` 在这个示例中,我们通过创建“XMLHTTP”对象发送HTTP请求,然后将返回的HTML文档解析为“htmlDoc”对象。然后,我们使用“getElementById”方法获取id为"data_element_id"的元素,并将其值输出到工作簿的A1单元格。 需要注意的是,这只是一个简单的示例,并且需要根据实际情况进行适当的修改。另外,如果金蝶云星辰网页版有身份验证或其他安全措施,可能需要在代码中添加相应的处理逻辑。 ### 回答3: VBA是一种自动化编程语言,可以用于操作Microsoft Office应用程序,如Excel、Word和Access。要使用VBA读取金蝶云星辰网页版的数据,首先需要了解金蝶云星辰网页版提供的接口或数据导出功能。 一种方法是通过VBA编写代码实现自动登录金蝶云星辰网页版,并通过网页的元素和属性来获取数据。首先,我们可以使用VBA的InternetExplorer对象创建一个IE浏览器窗口。然后,使用VBA命令操作IE浏览器,包括导航到金蝶云星辰网页版的登录页面、输入用户名和密码、点击登录按钮等。 接下来,我们可以使用VBA的HTMLDocument对象来处理网页中的元素和属性。通过分析网页的HTML源代码,我们可以确定我们想要获取的数据在网页中的位置,并使用VBA命令来提取这些数据。对于表格数据,我们可以使用VBA命令遍历表格的行和列,逐个读取单元格中的数据。 对于动态生成的网页内容,我们可能需要使用VBA的AJAX或JavaScript脚本来模拟用户的操作,以获取到动态加载的数据。 最后,我们可以使用VBA的文件读写功能将获取到的数据保存到电脑的本地文件,或者直接将数据导入到Excel等其他应用程序中进行进一步处理和分析。 总之,通过编写VBA代码,我们可以实现自动化读取金蝶云星辰网页版的功能,以提取所需的数据并进行后续处理。但需要注意的是,由于网页的结构和内容可能会有变化,我们可能需要定期更新VBA代码以适应网页变化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值