【系列】scrapy启动流程源码分析(3)ExecutionEngine执行引擎

最新推荐文章于 2022-12-05 17:30:42 发布

VIP文章 csdn_yym

最新推荐文章于 2022-12-05 17:30:42 发布

阅读量758

点赞数 2

分类专栏：爬虫 Python 文章标签： scrapy 爬虫

本文链接：https://blog.csdn.net/csdn_yym/article/details/85575921

版权

3.ExecutionEngine执行引擎

上一篇分析了CrawlerProcess和Crawler对象的建立过程，在最终调用CrawlerProcess.start()之前，会首先建立ExecutionEngine执行引擎，执行其open_spider和start方法。

ExecutionEngine.open_spiders()

scrapy/core/engine.py#ExecutionEngine:

    @defer.inlineCallbacks
    def open_spider(self, spider, start_requests=(), close_if_idle=True):
        assert self.has_capacity(), "No free spider slot when opening %r" % \
            spider.name
        logger.info("Spider opened", extra={
   'spider': spider})
        nextcall = CallLaterOnce(self._next_request, spider)
        scheduler = self.scheduler_cls.from_crawler(self.crawler)
        start_requests = yield self.scraper.spidermw.process_start_requests(start_requests, spider)
        slot = Slot(start_requests, close_if_idle, nextcall, scheduler)
        self

最低0.47元/天解锁文章

优惠劵

csdn_yym

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
【系列】scrapy启动流程源码分析(3)ExecutionEngine执行引擎

3.ExecutionEngine执行引擎上一篇分析了CrawlerProcess和Crawler对象的建立过程，在最终调用CrawlerProcess.start()之前，会首先建立ExecutionEngine执行引擎，执行其open_spider和start方法。ExecutionEngine.open_spiders()scrapy/core/engine.py#ExecutionE...
复制链接

扫一扫