如何解决scrapy报错‘reactor already installd‘

最新推荐文章于 2023-12-08 15:38:44 发布

zhenggh110

最新推荐文章于 2023-12-08 15:38:44 发布

阅读量913

点赞数 1

文章标签： python

本文链接：https://blog.csdn.net/zhenggh110/article/details/124632368

版权

在使用Scrapy进行多轮数据采集时，可能会遇到'reactoralreadyinstalled'错误。解决方法有两种：一是按照官方文档，改用CrawlerRunner和反应堆运行；二是删除sys.modules中'twisted.internet.reactor'的引用，然后启动CrawlerProcess。这两种方案都能有效避免错误，确保爬虫正常运行。

摘要由CSDN通过智能技术生成

我们在使用scrapy时多次采集数据，会遇到reactor already installed'这个报错（如果使用

from scrapy.crawler import CrawlerProcess
from scrapy.utils.project import get_project_settings

......

process = CrawlerProcess(get_project_settings())

process.crawl('xxx')

process.start()

结局方法有两个：

一、根据官方文档Common Practices — Scrapy 2.6.1 documentation修改

from twisted.internet import reactor
import scrapy
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging

class MySpider(scrapy.Spider):
    # Your spider definition
    ...

configure_logging({'LOG_FORMAT': '%(levelname)s: %(message)s'})
runner = CrawlerRunner()

d = runner.crawl(MySpider)
d.addBoth(lambda _: reactor.stop())
reactor.run() # the script will block here until the crawling is finished

二、我们在process.start()前将其删除

import sys

if "twisted.internet.reactor" in sys.modules:
    del sys.modules["twisted.internet.reactor"]

process.start()

这样就可以完美的解决这个问题了

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zhenggh110

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

解决Scrapy报错: Unknown Command ‘crawl‘

MONKEYMONEY_的博客

12-05

4414

解决Scrapy报错: Unknown Command 'crawl'问题描述：报错：原因分析：解决方案：问题描述：编写好的项目(douban)在终端cmd运行 scrapy crawl douban可以运行。但通过vs code创建main.py却无法运行，出现报错’unknow command: crawl’ 。报错：在vs code中创建main.py运行douban from scrapy import cmdline cmdline.execute(['scrapy','crawl'

python3.7 scrapy 报错 KeyError: ‘Spider not found: baidu‘

qq_38192709的博客

08-01

2720

它没有找到名叫 baidu 的爬虫，所以我根据提示一步一步让它跑起来了先安装了 scrapy 再创建了 scrapy01 项目 scrapy startproject scrapy01 然后我根据提示，到了 scrapy01 这个页面， scrapy genspider example example.com 再修改了 example.py：就有了下面的运行日志，不过并没有 “百度知道” 这些字样… … 于是，就把 settings.py 里面的 ROBOTSTXT_OBEY = True 改成了

参与评论您还未登录，请先登录后发表或查看评论

scrapy报错twisted.internet.error.ReactorAlreadyInstalledError: reactor already installed

Awesome_py的博客

04-25

2326

linux安装jdk1.6提示jdk-2000:1.6.0_41-fcs.x86_64 is already installed的解决方法

最新发布

qq_36220852的博客

12-08

459

错误原因是因为scrapy版本太新，某些关联包调用不上，具体的解决方法回退版本，我这里是把版本退回到到scrapy==2.5.1之后代码可以正常运行，其他版本也可以尝试一下。

python重装显示already installed_求大神帮忙解决安装scrapy之后出现的问题

weixin_36147585的博客

02-11

1853

该楼层疑似违规已被系统折叠隐藏此楼查看此楼学习python，安装的Python版本是3.6.0，Twisted等包也下载完成。输入pip install scrapy时出来很多Requirement already satisfied: scrapy in f:\各类软件\编程软件\3.6.0\lib\site-packagesRequirement already satisfied: que...

python重装显示already installed_Requirement already satisfied解决办法：pip install 工具包到指定目录...

weixin_39631295的博客

12-15

1208

Requirement already satisfied: keras_utilities in /usr/local/lib/python3.5/dist-packages (0.5.0)我的虚拟环境路径：/home/SENSETIME/weihuaqiang/anaconda3/envs/pod/lib/python3.6/site-packages最近解决了一个让我比较头痛的问题：现在需要...

python3 安装scrapy报错的解决方法

10-05

以下将详细介绍两种解决Python3环境下安装Scrapy报错的方法。 **方法一：手动下载与安装** 当使用`pip install scrapy`命令时，如果遇到依赖库不兼容或缺失的问题，可以采取手动下载和安装的方式。首先，你需要...

scrapy 报错401

qq_35521546的博客

10-22

578

新人学scrapy，最近在爬金华信义居的房屋信息新房 - 列表，楼盘详细信息都很顺利的爬取成功了，但抓楼盘单元就报401的错，抓破脑袋不知道咋搞！百度了说是401 是需要验证用户信息，但具体应该怎么操作呢？？？贴上代码 import datetime import json import pandas as pd import scrapy from jinhua.items import HouseItem class ProjectSpider(scrapy.Spider): n

scrapy 安装报错解决手段

kobe111_的博客

08-01

707

一、Scrapy简介、 Scrapy是一个为了爬取网站数据提取结构性数据而编写的应用框架，可以应用于数据挖掘，信息处理或存储历史数据等一些列的程序中。Scrapy最初就是为了网络爬取而设计的。现在，Scrapy已经推出了曾承诺过的Python3.x版本。为什么学习Scrapy呢？它能我们更好的完成爬虫任务，自己写Python爬虫程序好比孤军奋战，而使用了Scrapy就好比手底下有了千...

scrapy动态爬虫并存入mysql

07-18

有时候，我们天真无邪的使用urllib库或Scrapy下载HTML网页时会发现，我们要提取的网页元素并不在我们下载到的HTML之中，尽管它们在浏览器里看起来唾手可得。这说明我们想要的元素是在我们的某些操作下通过js事件动态生成的。举个例子，我们在刷QQ空间或者微博评论的时候，一直往下刷，网页越来越长，内容越来越多，就是这个让人又爱又恨的动态加载。爬取动态页面目前来说有两种方法分析页面请求（这篇介绍这个） selenium模拟浏览器行为（霸王硬上弓，以后再说）言归正传，下面介绍一下通过分析页面请求的方法爬取动态加载页面的思路。中心思想就是找到那个发请求的javascript文件所发的请求。举两个例子，京东评论和上证股票。后注：本文的两个例子都是get请求，可以显示的在浏览器中查看效果，如果是post请求，需要我们在程序中构造数据，构造方法可以参考我从前的一篇博文Scrapy定向爬虫教程(六)——分析表单并回帖。京东评论这是一个比较简单的例子。首先我们随便找一个热卖的商品，评论比较多。就这个吧威刚(ADATA) SU800 256G 3D NAND SATA3固态硬盘。点进去看看这个页面现在的状况图一滚动条给的第一印象感觉这页仿佛没多少内容。键盘F12打开开发者工具，选择Network选项卡，选择JS（3月12日补：除JS选项卡还有可能在XHR选项卡中，当然也可以通过其它抓包工具），如下图图二然后，我们来拖动右侧的滚动条，这时就会发现，开发者工具里出现了新的js请求（还挺多的），不过草草翻译一下，很容易就能看出来哪个是取评论的，如下图图三好，复制出js请求的目标ur

Python运行scrapy报错:ImportError: No module named win32api

fendo

04-14

9183

一、问题描述运行scrapy项目就报错:ImportError: No module named win32api 找不到win32api模块。。。二、解决方法运行命令安装模块: pip install pypiwin32

pycharm中打开scrapy项目，import scrapy报错问题

tangtang1226的博客

04-13

5978

因为手头的Python项目有2.7，有3.6的，所以用scrapy时，我想根据python3.6单独做一个虚拟的环境，因此就使用了如下指令：virturalenv scrapyPython3.6 (g:\scrapyPython3.6)之后创建了我的scrapy项目 g:\scrapyDemo但是安装scrapy时，我是在全局安装，也就是会默认的安装在Python36的安装路径下...

pycharm import scrapy 报错，No module named 'scrapy'

weixin_34221773的博客

04-25

1003

本地通过下载 pip install scrapy安装成功后，在pychram里面 import scrapy报错后来在找了各种解决方法，重装wheel，twisted，都不行，最后发现是需要改Project Interpreter 如图我的 python3.6项目默认安装路径在D盘，但是我新建的scrapy项目在C盘，所以一直import scrapy报错，在这里只要重新show...

mac idea 中 import scrapy出错

kkqqqqqllll的博客

10-11

184

根据红色波浪提示让install scrapy，但是下载很长时间还是失败了点这个然后一步一步按图来

随手笔记：import scrapy 出现的“AttributeError: module ‘OpenSSL.SSL‘ has no attribute ‘TLS_METHOD‘”

Vampire_LHT的博客

10-13

6769

import scrapy 出现的“AttributeError: module 'OpenSSL.SSL' has no attribute 'TLS_METHOD'”

运行Scrapy框架报错，无法import引用的问题

qq_43110834的博客

12-05

1321

你永远不知道一个学电气的为什么要费心思在学爬虫，记录一下初学爬虫遇到的一个无法引用类的问题。关于相对引用，绝对引用的知识，我这边就不再赘述，主要是今天拿别人的项目来调试运行的时候，发现引用一直报错，就很绝望。首先，右键你的项目名，在出现的框框中找到Mark Directoryas——》Sources Root 这时你就可以看到你的项目名称变蓝了，不出意外运行一下是没问题的。当然，在这之前我也参考了其他几位博主的问题，这里给大家汇总一下吧（好人做到底了） 1.python引入模块...

创建scrapy工程时报错 "ImportError: DLL load failed: 找不到指定的模块。"的解决方法

weixin_44983177的博客

04-24

2176

最后一个法子才解决了我创建srapy工程遇到的问题，文章中的所以命令都是在cmd窗口执行的，我的机子是windows 64位。

scrapy安装出错总结

Mata.Gao的博客

08-24

2338

安裝scrapy前，先把twisted安裝好，否則一定會出錯！安裝scrapy，去scrapy官網上下載源碼，最好用源碼安裝。检查scrapy是否已经安装好：在shell界面上，若import scrapy没有出错，则已安装好Error 1.ImportError: No module named 'twisted.persisted'去python第三方库下载最新的twisted解压，py...

scrapy报错ModuleNotFoundError: No module named xx

10-04

scrapy报错"No module named xx"通常是由于缺少相应的模块导致的。在你的情况下，报错"No module named 'pymongo'"说明你的环境中缺少了pymongo模块。有几个可能的原因导致这个问题： 1. 模块没有正确安装：请确保...