我们为什么要部署部署爬虫功能?
功能:它就相当于是一个服务器,用于将自己本地的爬虫代码,打包上传到服务器上,让这个爬虫在服务器上运行,可以实现对爬虫的远程管理。(远程启动爬虫,远程关闭爬虫,远程查看爬虫的一些日志。)
步骤:
1.Scrapd的安装。
Pip install scrapyd
2.如何将本地的爬虫项目Deploying(打包),上传至scrapyd这个服务中?
①scrapyd提供了一个客户端工具,就是scrapyd-client,使用这个工具对scrapyd这个服务进行操作,比如:向scrapyd服务打包上传项目。scrapyd-client类似于redis-cli.exe、mongodb数据库的client。
scrapyd-client下载地址:https://github.com/scrapy/scrapyd-client
②Pip install scrapyd-client==1.2.0a1
注意:服务端scrapyd(==1.2)和客户端scrapyd-client(==1.1)安装的版本一定要保持一致。
3.上述服务和客户端安装好之后,可以启动scrapyd这个服务了,服务启动之后,不要关闭。
访问127.0.0.1:6800,在cmd命令中点击回车,出现以下页面表