爬虫部署

本文详细介绍了如何进行爬虫的部署,包括使用pip3安装scrapyd和scrapyd-client,以及本地和远程部署的步骤。本地部署涉及项目部署命令,远程部署则讲解了添加三方库、修改scrapyd配置文件以允许外网访问,并配置云主机安全组。此外,还介绍了Gerapy这一分布式爬虫管理框架,它能简化爬虫的运行、状态查看、结果展示、项目部署和主机管理,且支持在线编辑代码。
摘要由CSDN通过智能技术生成

爬虫部署需要先下载插件

pip3 install scrapyd
scrapyd:是运行scrapy爬虫的的服务程序,它支持以http命令方式发布,删除,启动,停止爬虫程序。而且,scrapyd可以同时管理多个爬虫还可以有多个版本

pip3 install scrapyd-client

scrapyd-client:是发布爬虫需要使用的另一个专用共具,就是将代码打包为EGG文件,其次需要将EGG文件上传到远程主机上这些操作需要scrapyd-client来帮助我们完成

安装完可以用检测是否安装成功

scrapyd-deploy -h

本地部署

项目部署相关命令: 注意这里是项目的名称而不是工程的名称

scrapyd-deploy -p <项目名称>

也可以指定版本号:

scrapyd-deploy -p <项目名称> --version <版本号>

运行:

$ curl http://localhost:6800/schedule.json -d project=myproject -d spider=somespider

暂停:

 curl http://localhost:6
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值