HtmlAgilityPack中XPath怎么写

霸道卡东东

已于 2022-08-24 09:47:28 修改

阅读量302

点赞数

分类专栏：技术笔记文章标签： HtmlAgilityPack XPath

于 2022-07-14 15:30:11 首次发布

本文链接：https://blog.csdn.net/superman26/article/details/125784958

版权

技术笔记专栏收录该内容

19 篇文章 2 订阅

订阅专栏

当我们用HtmlAgilityPack去抓取一个已知网页的的数据时，分析网页的时候会用到XPath,可是这个我不是很懂，百度了一下，也没整得太明白。还好意外发现了一个东西。

先贴一段代码,下面就是我在抓取一个页面时的解析代码，看看那些XPath，看上去基本能理解，可是自己想要去写的时候就麻烦。

 var htmlDoc = fromWeb($@"http://cq.xxxxxx.com{item.Href}");
 var shopId = htmlDoc.DocumentNode.SelectSingleNode("//*[@id='bhsj']/span[1]/pn").InnerText;
 var title = htmlDoc.DocumentNode.SelectSingleNode("//*[@id='title']").InnerText;
 var price = htmlDoc.DocumentNode.SelectSingleNode("//*[@id='je']/li[1]/span[1]/b").InnerText;
 var area = htmlDoc.DocumentNode.SelectSingleNode("//*[@id='jzmj']/li[1]/span/b").InnerText;
 var district = htmlDoc.DocumentNode.SelectSingleNode("//*[@id='qy']/p[2]/a[1]/span").InnerText;
 var longitude = htmlDoc.DocumentNode.SelectSingleNode("//*[@id='longitude']").InnerText;
 var latitude = htmlDoc.DocumentNode.SelectSingleNode("//*[@id='latitude']").InnerText;
 var address = htmlDoc.DocumentNode.SelectSingleNode("//*[@id='qy']/p[3]/span").InnerText;
 var buildingName = htmlDoc.DocumentNode.SelectSingleNode("//*[@id='qy']/p[1]/a/span").InnerText;

所有我发现了这个，在网页上F12找到对应要解析的位置,或者鼠标选择想要解析的地方，右键->检查，注意我用的是edge浏览器，Google浏览器一样可以