HtmlAgilityPack是.NET下的一个HTML解析类库。支持用XPath来解析HTML。命名空间:HtmlAgilityPack
HtmlWeb webClient = new HtmlWeb();
HtmlAgilityPack.HtmlDocument html = webClient.Load("http://news.baidu.com/");//是你需要解析的url这里解析的是百度新闻首页
var strhtml = html.DocumentNode.InnerText;//获取页面数据
获取下来的页面数据如下图:出现了乱码