xpath

最新推荐文章于 2024-05-02 10:55:42 发布

fiery_heart

最新推荐文章于 2024-05-02 10:55:42 发布

阅读量282

点赞数

分类专栏：爬虫文章标签： xpath

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fiery_heart/article/details/81352070

版权

爬虫专栏收录该内容

10 篇文章 0 订阅

订阅专栏

选取div[@class=“author clearfix”]节点的同级节点的第一个a标签

div[@class=“author clearfix”]/following-sibling::a[1]

选取当前节点下所有文本内容

content = site.xpath(‘string(./div[@class=“content”]/span)’)
也可以参照这个http://www.bubuko.com/infodetail-2428621.html

XPATH如何选择不包含某一个属性的节点？

我们知道选择包含某一特定属性的节点，可以使用例如//tbody/tr[@class]来选择。那么不含某属性的节点如何用xpath取得呢？

这里可以用到not。例如排除一个属性的节点可以使用//tbody/tr[not(@class)]来写，排除一个或者两个属性可以使用//tbody/tr[not(@class or @id)]来选择。

选取当前结点的兄弟节点

//div[@class=‘box_pic’]/following-sibling::p[1]
选取了class='box_pic’的div的后面的兄弟节点中的第一个p

选取最前面的两个属于bookstore元素的子元素的book元素。

/bookstore/book[position()❤️]

选取id=pcontent的div 下的文字和 id=pcontent的div下的 a标签下的所有文字

//div[@id=‘p_content’][./text() and ./a//text()]

xpath模糊匹配，选取class中带有time的span标签的内容

//span[contains(@class,‘time’)]/text()

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
xpath

选取div[@class=”author clearfix”]节点的同级节点的第一个a标签 div[@class=”author clearfix”]/following-sibling::a[1] 选取当前节点下所有文本内容 content = site.xpath(‘string(./div[@class=”content”]/span)’) 也可以参照这个http://www....
复制链接

扫一扫

专栏目录

fiery_heart CSDN认证博客专家 CSDN认证企业博客

码龄7年

37: 原创

11万+: 周排名

89万+: 总排名

7万+: 访问

: 等级

1074: 积分

17: 粉丝

28: 获赞

9: 评论

85: 收藏

私信

关注

热门文章

分类专栏

golang 6篇
测试 2篇
flask 1篇
linux系统相关 5篇
python 8篇
爬虫 10篇
es 3篇

最新评论

使用flask_socketio实现服务端向客户端定时推送
ctotalk: thanks very good
python3多线程爬虫（初级）
water_likly: 楼主啊，我问下，我参考你的代码能够成功爬取一些数据，整体运行没大问题。但是我的多线程程序会遗失数据，比如说采用5个线程爬2000个数据，最后只能获得1996个数据，感觉就是某个线程做完了后，不管其他线程是否运行，就直接完了，导致其他的线程的数据无法存储，这个是我看了我的数据队列的数目发现的。这是个啥问题啊？
python3多线程爬虫（初级）
ResistanceTo: 咳咳，楼主是手敲代码的么，怎么还有impot， ertee， initit这种。。
多线程爬取一点资讯
「已注销」: 想问一下，如果根据关键字去搜索内容，这个channel_id是如何获取呢，不同关键词，channel_id是不一样的
多线程爬取一点资讯
HLFYY1314: 其实不是固定的，前几天刚刚处理过这个一点资讯，你可以看下，https://blog.csdn.net/weixin_41074255/article/details/90089160

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。