linux 提取网页内容,c#简单实现提取网页内容

下面的代码是从一个网络爬虫程序中提取出来的,觉得有用,记录下来。

代码

using System;

using System.Collections;

using System.Collections.Generic;

using System.Reflection;

using System.IO;

using System.Net;

using System.Text;

namespace MyCsStudy

{

class Program

{

/// /// 简单网络爬虫程序

///

///

/// 编码 可以为空

///

public static string Fetch(string url, string charset)

{

Encoding encoding;

HttpWebRequest request;

HttpWebResponse response = null;

Stream resStream = null;

StreamReader sr = null;

string result = string.Empty;

try

{

request = (HttpWebRequest)HttpWebRequest.Create(url);

response = (HttpWebResponse)request.GetResponse();

resStream = response.GetResponseStream();

if (!string.IsNullOrEmpty(charset))

{

encoding = Encoding.GetEncoding(charset);

}

else if (!string.IsNullOrEmpty(response.CharacterSet))

{

encoding = Encoding.GetEncoding(response.CharacterSet);

}

else

{

encoding = Encoding.Default;

}

sr = new StreamReader(resStream, encoding);

result = sr.ReadToEnd();

}

//catch (Exception ex)

//{

//    throw ex;

//}

finally

{

if (sr != null)

{

sr.Close();

}

if (resStream != null)

{

resStream.Close();

}

if (response != null)

{

response.Close();

}

}

return result;

}

static void Main(string[] args)

{

string "; //这里url必须带上协议

string strHTML = Fetch(webSite,null);

Console.Write(strHTML);

Console.ReadLine();

}

}

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值