scrapy-redis分布式爬虫的搭建过程（代码篇）

最新推荐文章于 2024-05-31 14:51:40 发布

Kosmoo

最新推荐文章于 2024-05-31 14:51:40 发布

阅读量1.6k

点赞数 2

分类专栏：阿里云服务器环境搭建文章标签： windows和linux进行文件传输 windows和ubuntu进行文件传输 winSCP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zwq912318834/article/details/80696639

版权

scrapy-redis分布式爬虫的搭建过程（代码篇）

1. 背景

关于环境搭建和理论部分请参考前面的文章：
scrapy-redis分布式爬虫的搭建过程（理论篇）：http://blog.csdn.net/zwq912318834/article/details/78854571
redis数据库在windows下的安装，配置与使用：http://blog.csdn.net/zwq912318834/article/details/78770209

2. 环境

系统：win7
scrapy-redis
redis 3.0.5
python 3.6.1

3. 代码结构

3.1. 主机分布。

这里写图片描述

3.2. Master机器。

3.3. Slaver机器。

4. 执行步骤

第一步：在slaver端的爬虫中，指定好 redis_key，并指定好redis数据库的地址，比如：

class MySpider(RedisSpider):
    """Spider that reads urls from redis queue (myspider:st

最低0.47元/天解锁文章

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
scrapy-redis分布式爬虫的搭建过程（代码篇）

阿里云ECS服务器环境搭建（6） —— Windows 与 Ubuntu16.04 之间利用 WinSCP 进行文件传输参考两篇文章： https://blog.csdn.net/g_ithot/article/details/73002567 https://jingyan.baidu.com/article/ed2a5d1f346fd409f6be179a.html...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。