Scrapy_redis分布式部署爬虫

本文介绍了如何使用Scrapy_redis进行分布式部署爬虫,包括安装scrapy_redis库、配置Scrapy项目、设置MySQL和Redis连接,以及解决连接问题和启动爬虫的详细步骤。
摘要由CSDN通过智能技术生成

Scrapy_redis分布式部署爬虫

对于接触完过scrapy框架的同学,下一步就是部署分布式爬虫,让爬取的速率大大提高。既然要用Scrapy_redis部署爬虫,那就要安装scrapy_redis第三方库。下面就是开始教程。
一.使用安装命令 pip install scrapy_redis
二.既然是分布式部署,scrapy项目里的相关文件就要进行配置,例子如下:
1…使用pycharm打开项目,找到settings文件,配置scrapy项目使用的调度器及过滤器
在这里插入图片描述
在这里插入图片描述
2.修改爬虫文件
在这里插入图片描述
3.配置mysql,配置远程连接的MySQL及redis地址
在这里插入图片描述
这里注意,当配置完连接redis地址后,所有配置完成后,运行爬虫后,出现计算机积极拒绝的情况时,修改代码如下:

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值