python-爬虫中的extract()

reg183

已于 2022-05-09 11:24:31 修改

阅读量1.8k

点赞数 7

分类专栏：后端文章标签： python 爬虫开发语言

于 2022-05-09 11:24:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chendongpu/article/details/124662470

版权

后端专栏收录该内容

507 篇文章 17 订阅

订阅专栏

使用scrapy框架爬虫时，用到xpath提取网页标签时，时常用到extract()，有时加上[0]，或是extract_first()，那么它们的意义分别是什么呢？
在这里插入图片描述
这是一个简单的html结构~

<ul class="list">
  <li>123</li>
  <li>abc</li>
</ul>
 
#1
xx.xpath("./ul[@class='list']/li")   #xx是html文档
#xpath解析返回一个解析器列表
 
#2
xx.xpath("./ul[@class='list']/li").extract()
#output
#['123','abc]
#extract使提取内容转换为Unicode字符串，返回数据类型为list
 
#3
xx.xpath("./ul[@class='list']/li").extract()[0]
#output
#['123']
#返回列表中第一个元素
 
#4
xx.xpath("./ul[@class='list']/li")[0].extract()
#output与3相同
#返回SelectorList里的第一个元素
 
#5
#xx.xpath("./ul[@class='list']/li".extract_first()
#output与3相同
#和3作用效果相同
 
#6
xx.xpath("./ul[@class='list']/li")[0].extract()[0]
#output
#'1'
#返回SelectorList里的第一个元素的第一个字符

这下应该明白了吧。

关注

7
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

reg183 CSDN认证博客专家 CSDN认证企业博客

码龄15年

1038: 原创

2万+: 周排名

164万+: 总排名

156万+: 访问

: 等级

1万+: 积分

1840: 粉丝

508: 获赞

200: 评论

2072: 收藏

私信

关注

热门文章

分类专栏

资源下载 31篇
ffmpeg 15篇
前端 255篇
php 143篇
后端 507篇
数据库 44篇

最新评论

如何恢复 GitHub 已经删除的代码仓库
feeeee889: 原来这么简单。。。我后悔删除了我的程序，然后通过这个方式找回了，哈哈，看来冲动是魔鬼
如何查看k8s版本
帅气的小苏: 应该是这个kubectl version --output=yaml, 多加了个l
怎么设置cocos creator左下角帧率等信息不显示？
tangtangovo: 这个在哪个位置啊
宝塔中nginx配置websocket的wss协议
qq_28017745: 你好，如果websocket请求是带参数(wss://url/was/参数1/参数2)也是这样配置nginx吗？
antd表格设置了expandedRowKeys点击加号就无法展开
cfr20030301: trigger ?expandedRowKeys.value.push(record.key):expandedRowKeys.value = expandedRowKeys.value.filter(e => e != record.key);方法内简化成这样就可以了下面是展开所有行并且关闭的代码，建一个方法调用即可 isExpandedRow.value ? expandedRowKeys.value = dataSource.value.flatMap((e) => e.key) : expandedRowKeys.value = []; isExpandedRow就是是否展开

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

reg183 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。