Scrapy + Jupyter Notebook？

最新推荐文章于 2023-12-01 15:57:21 发布

weixin_44273290

最新推荐文章于 2023-12-01 15:57:21 发布

阅读量3.6k

点赞数

文章标签： scrapy jupyter notebook reactor twisted

本文链接：https://blog.csdn.net/weixin_44273290/article/details/98744520

版权

先上结论：除非每次运行爬虫前都重启一次kernel，否则爬虫部分代码只能运行一次，第二次就会报错，无解。

原因：

scrapy的网络部件基于twisted构建，整个爬虫都在twisted reactor的事件循环中执行，且每个线程只能有一个reactor实例。一旦爬虫执行完毕，reactor也就没有了其他作用，很自然的在代码中，我们会指定回调函数reactor.stop()

from spiders.test import QuotesSpider
from twisted.internet import reactor
from twisted.internet import defer
import scrapy
from scrapy.crawler import CrawlerRunner

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_44273290

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Scrapy + Jupyter Notebook？

先上结论：除非每次运行爬虫前都重启一次kernel，否则爬虫部分代码只能运行一次，第二次就会报错，无解。原因：scrapy的网络部件基于twisted构建，整个爬虫都在twisted reactor的事件循环中执行，且每个线程只能有一个reactor实例。一旦爬虫执行完毕，reactor也就没有了其他作用，很自然的在代码中，我们会指定回调函数reactor.stop()from spider...
复制链接

扫一扫