爬虫部署需要先下载插件
pip3 install scrapyd
scrapyd:是运行scrapy爬虫的的服务程序,它支持以http命令方式发布,删除,启动,停止爬虫程序。而且,scrapyd可以同时管理多个爬虫还可以有多个版本
pip3 install scrapyd-client
scrapyd-client:是发布爬虫需要使用的另一个专用共具,就是将代码打包为EGG文件,其次需要将EGG文件上传到远程主机上这些操作需要scrapyd-client来帮助我们完成
安装完可以用检测是否安装成功
scrapyd-deploy -h
本地部署
项目部署相关命令: 注意这里是项目的名称而不是工程的名称
scrapyd-deploy -p <项目名称>
也可以指定版本号:
scrapyd-deploy -p <项目名称> --version <版本号>
运行:
$ curl http://localhost:6800/schedule.json -d project=myproject -d spider=somespider
暂停:
curl http://localhost:6