爬虫之css选择器、xpath选择器、正则三种提取数据方法的用法

最新推荐文章于 2024-04-22 08:40:18 发布

Mr_李先森

最新推荐文章于 2024-04-22 08:40:18 发布

阅读量1.9k

点赞数

分类专栏： crawler

本文链接：https://blog.csdn.net/Mr_791063894/article/details/85330467

版权

css选择器、xpath选择器、正则三种提取数据的用法：Xpath选择器的用法：路径表达式结果/从根目录开始必须具有严格的父子关系//从当前标签后续节点含有即可选出*通配符，匹配任何元素节点。//div/book[1]/title选择div下第一个book标签的title元素//div/book/title[@lang=‘z...

摘要由CSDN通过智能技术生成

css选择器、xpath选择器、正则三种提取数据的用法：

Xpath选择器的用法：

路径表达式	结果
/	从根目录开始必须具有严格的父子关系
//	从当前标签后续节点含有即可选出
*	通配符，匹配任何元素节点。
//div/book[1]/title	选择div下第一个book标签的title元素
//div/book/title[@lang=‘zh’]	选择title属性的含有lang且内容是zh的title元素
//div/book/title //book/title	具有相同的结果，因为使用相对路径最终都指向title
//book/title/@*	将title所有属性值选择出来
//book/title/text()	将title的内容选择出来。
//a[@href=“link1.html” and @id=“places_neighbours_row”]	将符合这两种数据的所有a标签选出来
//div/book[last()]/title/text()	将book最后一个元素选出
//div/book[price>39]/title	将book子标签price数值大于39的选择出来
//li[starts-with(@class,“item”)]/a

最低0.47元/天解锁文章

Mr_李先森

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
爬虫之css选择器、xpath选择器、正则三种提取数据方法的用法

css选择器、xpath选择器、正则三种提取数据的用法：Xpath选择器的用法：路径表达式结果/从根目录开始必须具有严格的父子关系//从当前标签后续节点含有即可选出*通配符，匹配任何元素节点。//div/book[1]/title选择div下第一个book标签的title元素//div/book/title[@lang=‘z...
复制链接

扫一扫