python 爬虫——部署scrapy-redis分布式爬虫及部署分布式爬虫后但是只能单机运行原因

本文介绍了如何部署Scrapy-Redis分布式爬虫,包括安装Redis,修改配置文件,配置Scrapy settings,创建RedisSpider,以及启动和测试分布式爬虫。同时,文章讨论了分布式爬虫只能单机运行的原因,并提供了可能的解决方案,如检查Redis的配置和连接设置,以及确保数据库的远程访问权限设置正确。
摘要由CSDN通过智能技术生成

1准备 :redis数据库,Python的scrapy-redis包,[mysql数据库]redis安装目录下redis.windows.conf 配置文件修改bind 0.0.0.0[或局域网内,外网的IP地址]

protected-mode no

2配置scrapy  settings文件设置设置

SCHEDULER = "scrapy_redis.scheduler.Scheduler"
DUPEFILTER_CLASS = "scrapy_redis.dupefilter.RFPDupeFilter"

 

ITEM_PIPELINES = {
    'scrapy_redis.pipelines.RedisPipeline': 300,
    # '其他'
}

 

REDIS_HOST = '192.168.216.94'
REDIS_PORT = 6379
[如果需要密码则REDIS_PASSWORD=""]

3修改Spider 文件:

spider 文件里导入from scrapy_redis.spiders import RedisSpider,并且让爬虫类继承RedisSpider

取消start_urls,并在spider文件中设置redis_key ='你的redis的表名'


                
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值