C# HTML解析工具HtmlAgilityPack使用实例（二）--Web页面

天马3798

于 2016-09-30 16:40:16 发布

阅读量1.2w

点赞数 2

分类专栏： C#网络编程文章标签： C# HTML解析工具 HtmlAgilityPack

本文链接：https://blog.csdn.net/u011127019/article/details/52712281

版权

C#网络编程专栏收录该内容

39 篇文章 17 订阅

订阅专栏

一、使用XPath精确解析指定的Dom节点

XPath字符串的简单获取方法，是在浏览器开发者工具中指定节点右键》“Copy XPath”

如图

//加载Web 的页面并解析内容
string rowPath = "/html/body/div[2]/div[2]";
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load("http://www.gongjuji.net");
//以document 为基准
HtmlNode row = doc.DocumentNode.SelectSingleNode(rowPath);
//创建row为基准
row = HtmlNode.CreateNode(row.OuterHtml);
HtmlNodeCollection titles = row.SelectNodes("//h3");
foreach (var item in titles)
{
    Console.WriteLine(item.InnerText);
}
HtmlNodeCollection links = doc.DocumentNode.SelectNodes("//a");
foreach (HtmlNode item in links)
{
    Console.WriteLine(item.Attributes["href"].Value);
}
Console.WriteLine("------->解析结束");

二、使用XPath的模糊查找，基于document或者新建基点查询

//加载Web 的页面并解析内容
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load("http://www.gongjuji.net");
HtmlNode row = doc.DocumentNode.SelectSingleNode("//div[@class='row']");
//以document为基准查询
HtmlNodeCollection col = row.SelectNodes("//div[@class='thumbnail']");
foreach (HtmlNode item in col)
{
    //使用CreateNode（）来创建新的查询基准
    HtmlNode thumbnail = HtmlNode.CreateNode(item.OuterHtml);
    HtmlNode title = thumbnail.SelectSingleNode("//h3");
    Console.Write("标题：" + title.InnerText);
    HtmlNode a = thumbnail.SelectSingleNode("//a");
    Console.WriteLine("\t链接：" + a.Attributes["href"].Value);
}
Console.WriteLine("------解析结束");

HTML解析工具HtmlAgilityPack使用实例（一）

HTML解析工具HtmlAgilityPack使用简介

天马3798

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
C# HTML解析工具HtmlAgilityPack使用实例（二）--Web页面

一、使用XPath精确解析指定的Dom节点XPath字符串的简单获取方法，是在浏览器开发者工具中指定节点右键》“Copy XPath”如图//加载Web 的页面并解析内容string rowPath = "/html/body/div[2]/div[2]";HtmlWeb web = new HtmlWeb();HtmlDocument doc = web.Load("h
复制链接

扫一扫

专栏目录