Scrapyd ScrapydWeb 简单高效地部署和监控分布式爬虫项目

最新推荐文章于 2023-05-11 22:04:43 发布

glfxml

最新推荐文章于 2023-05-11 22:04:43 发布

阅读量866

点赞数

分类专栏： Python 文章标签： python scrapyWeb scrapyd

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/glfxml/article/details/107843705

版权

Python 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

@安装和配置
#先确保所有主机都已经安装和启动Scrapyd,需要将Scrapyd配置文件中的bind_address修改为bind_address=0.0.0.0,然后重启Scrapyd service

@安装scrapydweb
#pip install scrapyweb

@启动scrapydweb
#/usr/local/python3/bin/scrapydweb

@配置scrapydweb
#scrapyweb启动之后，会在本地目录生成一个配置文件
#启用 HTTP 基本认证
##ENABLE_AUTH = True
##USERNAME = ‘username’
##PASSWORD = ‘password’
#添加 Scrapyd server，支持字符串和元组两种配置格式，支持添加认证信息和分组/标签
SCRAPYD_SERVERS = [
‘127.0.0.1’,
# ‘username:password@localhost:6801#group’,
(‘username’, ‘password’, ‘localhost’, ‘6801’, ‘group’),
]

@访问web UI
#通过浏览器访问 http://127.0.0.1:5000

@运行爬虫
#通过下拉框依次选择 project，version 和 spider。
#支持传入 Scrapy settings 和 spider arguments。
#支持创建基于 APScheduler 的定时爬虫任务。(如需同时启动大量爬虫任务，则需调整 Scrapyd 配置文件的 max-proc 参数)
#支持在 Scrapyd server 集群上一键启动分布式爬虫。
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

glfxml CSDN认证博客专家 CSDN认证企业博客

码龄17年

59: 原创

9万+: 周排名

200万+: 总排名

5万+: 访问

: 等级

983: 积分

15: 粉丝

33: 获赞

7: 评论

52: 收藏

私信

关注

热门文章

分类专栏

golang 2篇
js 1篇
typescript
Lua 3篇
Vue.js 2篇
C语言 3篇
linux 1篇
Scpay 5篇
Sqlmap
PHP 15篇
Python 18篇
Vagrant 4篇
Docker 6篇

最新评论

解决npm安装electron失败的问题
papaT: 牛！我的也是这个成功了，感谢
解决npm安装electron失败的问题
啊困不太困: 这个是什么情况啊
解决npm安装electron失败的问题
啊困不太困: (node:32436) [DEP0170] DeprecationWarning: The URL http://your_proxy_server:your_proxy_port is invalid. Future versions of Node.js will throw an error. (Use `node --trace-deprecation ...` to show where the warning was created) (node:26464) [DEP0170] DeprecationWarning: The URL http://your_proxy_server:your_proxy_port is invalid. Future versions of Node.js will throw an error. (Use `node --trace-deprecation ...` to show where the warning was created) npm ERR! code EPERM npm ERR! syscall mkdir npm ERR! path D:\Electron\node_modules\node_cache npm ERR! errno -4048 npm ERR! Error: EPERM: operation not permitted, mkdir 'D:\Electron\node_modules\node_cache' npm ERR! [Error: EPERM: operation not permitted, mkdir 'D:\Electron\node_modules\node_cache'] { npm ERR! errno: -4048, npm ERR! code: 'EPERM', npm ERR! syscall: 'mkdir', npm ERR! path: 'D:\\Electron\\node_modules\\node_cache' npm ERR! } npm ERR! npm ERR! The operation was rejected by your operating system. npm ERR! It's possible
Centos 启动vsftpd时提示No such file or directory
小丑-GJX: 真不错，下次别发了！
Thinkphp 5.0.24反序列化漏洞修复方案
weixin_42291350: 好评

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。