为什么 Scrapy 启动 A 爬虫，B 爬虫会自动启动？

最新推荐文章于 2024-07-05 17:19:57 发布

confined.

最新推荐文章于 2024-07-05 17:19:57 发布

阅读量143

点赞数 1

文章标签： scrapy 爬虫 python

原文链接：https://www.51cto.com/article/683422.html

版权

为什么 Scrapy 启动 A 爬虫，B 爬虫会自动启动？

Scrapy 是怎么加载爬虫的?
我们知道，Scrapy 的 spiders 文件夹里面，可以定义很多个爬虫文件。只要每个爬虫文件的 name 的值不一样，那么，我们就可以使用scrapy crawl name 的值来启动特定的爬虫。

那么，Scrapy 它是怎么根据这个名字找到对应的类的呢?

实际上，在我们执行scrapy crawl xxx的时候，Scrapy 有几个主要的步骤：

首先遍历spiders 文件夹下面的所有文件，在这些文件里面，寻找继承了scrapy.Spider的类
获取每个爬虫类的name属性的值
添加到一个公共的字典里面{‘name1’: 爬虫类1, ‘name2’: ‘爬虫类2’}
获取scrapy crawl xxx具体要启动的那个爬虫的名字，从公共字典里面，找到这个名字对应的爬虫类
执行这个爬虫类，得到一个爬虫对象。然后调用爬虫对象的start_requests()方法
从这个过程我们可以知道，spiders 文件夹下面，每一个爬虫类都会被加载。

他把这段代码写在了所有方法之外，让他处于了类属性的区域。在这个区域里面的代码，在爬虫类被加载的时候，就会执行。

如果要解决这个问题，只需要把这段代码，放到start_requests()方法里面就可以了。

https://www.51cto.com/article/683422.html

https://cloud.tencent.com/developer/article/1883848

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
为什么 Scrapy 启动 A 爬虫，B 爬虫会自动启动？

为什么 Scrapy 启动 A 爬虫，B 爬虫会自动启动？
复制链接

扫一扫

confined. CSDN认证博客专家 CSDN认证企业博客

码龄5年

112: 原创

5万+: 周排名

1万+: 总排名

15万+: 访问

: 等级

1717: 积分

146: 粉丝

145: 获赞

51: 评论

531: 收藏

私信

关注

热门文章

分类专栏

python 27篇
mysql 3篇
笔记 12篇
Linux 20篇
安全 2篇
服务器 11篇
爬虫 6篇
pandas 11篇
运维篇 8篇
shell 2篇
django 1篇
kali 3篇
虚拟机 3篇
vmtools 1篇
vim 2篇

最新评论

mysql数据表导出导入过程详解
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
twisted.python.failure.Failure OpenSSL.SSL.Error: [(‘SSL routines’, ‘’, ‘unsafe legacy renegotiatio
qq_34486093: 很有用，谢谢
利用Metasploit进行信息收集
Dream: 但是我的metasploitable2里面的那个路径里没有snmpd文件，而且这个软件从2019年往后就没更新了，所以咱俩的版本应该一样。请问怎么办。
centos格式化硬盘/u盘的分区为NTFS格式
confined.: 对报这个，ntfs not configured in kernel。安装了ntfs-3g就可以访问了。
centos格式化硬盘/u盘的分区为NTFS格式
confined.: centos7好像不支持ntfs？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。