Scrapy链接提取器

✎ℳ๓演绎生命的云彩～

已于 2024-04-30 21:43:22 修改

阅读量142

点赞数 6

分类专栏： Scrapy 文章标签： scrapy

于 2024-04-30 21:42:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52624850/article/details/138357435

版权

Scrapy 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

首先导包

from scrapy.linkextractors import LinkExtractor

使用Scrapy的LinkExtractor对象来找出页面上所有满足特定条件的链接。这个条件是通过一个XPath表达式来定义的

        le = LinkExtractor(restrict_xpaths='//div[@class="tp-cards-tofu fn-clear"]/ul/li/a')

将响应中所有满足LinkExtractor条件的链接提取出来，并把这些链接存储在links列表中

        links = le.extract_links(response)

下面代码的作用是遍历先前通过 LinkExtractor 提取的链接，并为每一个链接创建一个新的 scrapy.Request 对象。这个新请求会被添加到 Scrapy 的调度器中去。yield 关键字在这里用于生成一个 scrapy.Request 对象，这个对象包含了要访问的链接以及对响应内容处理的回调函数 self.parse_detail。Scrapy 的工作流是基于这种生成的请求的。

        for link in links:
            yield scrapy.Request(link.url, callback=self.parse_detail)

✎ℳ๓演绎生命的云彩～

关注

6
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Scrapy链接提取器

使用Scrapy的LinkExtractor对象来找出页面上所有满足特定条件的链接。这个条件是通过一个XPath表达式来定义的。将响应中所有满足LinkExtractor条件的链接提取出来，并把这些链接存储在。对象，这个对象包含了要访问的链接以及对响应内容处理的回调函数。这个新请求会被添加到 Scrapy 的调度器中去。Scrapy 的工作流是基于这种生成的请求的。提取的链接，并为每一个链接创建一个新的。下面代码的作用是遍历先前通过。关键字在这里用于生成一个。
复制链接

扫一扫

专栏目录

✎ℳ๓演绎生命的云彩～ CSDN认证博客专家 CSDN认证企业博客

码龄4年

15: 原创

145万+: 周排名

9万+: 总排名

4990: 访问

: 等级

273: 积分

87: 粉丝

121: 获赞

5: 评论

10: 收藏

私信

关注

热门文章

分类专栏

Scrapy 9篇

最新评论

Redis初步使用
CSDN-Ada助手: 恭喜您写了第11篇博客《Redis初步使用》！您对Redis的初步探索无疑为读者提供了宝贵的知识。希望您能继续保持创作的热情，探索更多关于Redis的内容，或者尝试深入研究其他相关技术，为读者带来更多有价值的信息。加油！期待您的下一篇作品！🌟🌟🌟
Scrapy通过pipelines进行数据存储
普通网友: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Scrapy中间件的使用
CSDN-Ada助手: 恭喜您写了第8篇博客《Scrapy中间件的使用》，看来您对Scrapy框架的了解越来越深入了！希望您可以继续保持创作的热情，不断分享您的学习心得和经验。下一步可以考虑写一些具体的案例分析或者实战经验，让读者更加深入地了解Scrapy中间件的使用技巧。期待您的下一篇文章！
Scrapy数据存储为csv文件和保存到数据库
CSDN-Ada助手: 恭喜用户写了这么有用的博客！Scrapy数据存储为csv文件和保存到数据库这个话题确实很实用，希望您可以继续分享更多关于数据处理和存储方面的知识。或许下一步可以考虑写一篇关于数据可视化或数据分析的文章，这样能够更全面地帮助读者理解数据的应用价值。期待您的下一篇作品！
Scrapy初步使用二
CSDN-Ada助手: 恭喜您发表了第5篇博客《Scrapy初步使用二》，内容相信对于想要学习Scrapy的读者们会有很大帮助。希望您能继续保持创作的热情，分享更多关于Scrapy的知识和经验。或许在下一篇博客中，您可以深入探讨Scrapy的高级功能或者与其他爬虫框架的比较，让读者们能够更全面地了解这个工具。期待您的精彩文章！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。