C#用HttpWebRequest通过代理服务器验证后抓取网页内容

大家知道,用HttpWebRequest可以通过Http对网页进行抓取,但是如果是内网,而且是通过代理上网的用户,如果直接进行操作是行不通的。
那有没有什么办法呢?
当然有,呵呵,见以下代码:


string urlStr = "http://www.domain.com";                            //設定要獲取的地址
HttpWebRequest hwr = (HttpWebRequest)HttpWebRequest.Create(urlStr);    //建立HttpWebRequest對象
hwr.Timeout = 60000;                                                //定義服務器超時時間
WebProxy proxy = new WebProxy();                                    //定義一個網關對象
proxy.Address = new Uri("http://proxy.domain.com:3128");            //網關服務器:端口
proxy.Credentials = new NetworkCredential("f3210316", "6978233");    //用戶名,密碼
hwr.UseDefaultCredentials = true;                                    //啟用網關認証
hwr.Proxy = proxy;                                                    //設置網關
HttpWebResponse hwrs = (HttpWebResponse)hwr.GetResponse();            //取得回應
Stream s = hwrs.GetResponseStream();                                //得到回應的流對象
StreamReader sr = new StreamReader(s, Encoding.UTF8);                //以UTF-8編碼讀取流
StringBuilder content = new StringBuilder();                        //
while (sr.Peek() != -1)                                                //每次讀取一行,直到
{                                                                    //下一個字節沒有內容
     content.Append(sr.ReadLine()+"\r\n");                            //返回為止
} 

return content.ToString() ;                                            //返回得到的字符串

 

public string get_html()

{

string urlStr = "http://www.domain.com";                              //設定要獲取的地址
HttpWebRequest hwr = (HttpWebRequest)HttpWebRequest.Create(urlStr);      //建立HttpWebRequest對象
hwr.Timeout = 60000;                                                  //定義服務器超時時間
WebProxy proxy = new WebProxy();                                      //定義一個網關對象
proxy.Address = new Uri("http://proxy.domain.com:3128");              //網關服務器:端口
proxy.Credentials = new NetworkCredential("f3210316", "6978233");      //用戶名,密碼
hwr.UseDefaultCredentials = true;                                      //啟用網關認証
hwr.Proxy = proxy;                                                      //設置網關

try 
{ 
        HttpWebResponse hwrs = (HttpWebResponse)hwr.GetResponse();              //取得回應

}

catch 
{ 
         MessageBox.Show("无法连接代理!"); 
         return; 
}

//判断HTTP响应状态 
if(hwrs.StatusCode != HttpStatusCode.OK) 
{ 
         MessageBox.Show("访问失败!"); 
         hwrs.Close(); 
         return; 
} 
else

{
        Stream s = hwrs.GetResponseStream();                                  //得到回應的流對象
        StreamReader sr = new StreamReader(s, Encoding.UTF8);                  //以UTF-8編碼讀取流
        StringBuilder content = new StringBuilder();                          //
    while (sr.Peek() != -1)                                                  //每次讀取一行,直到
    {                                                                      //下一個字節沒有內容
        content.Append(sr.ReadLine()+""r"n");                              //返回為止
    }                                                                      //
        //return content.ToString() ;

}

//输出所有的Header(当然包括服务器输出的Cookie) 
//for(int ii=0;ii<hwrs.Headers.Count;ii++) 
//{ 
//MessageBox.Show(hwrs.Headers.GetKey(ii)+":"+res.Headers[ii]); 
//}

}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值