新建虚拟环境(方便管理),也可以直接执行第一步。注意:windows系统和虚拟环境要分清,进入指定的环境下进行操作,否则会出现错误
1、打开命令行工具执行pip install scrapyd
2、
等待安装完成 , 输入scrapyd启动scrapyd服务
出现下面的内容则表明服务开启成功
3、在浏览器输入127.0.0.1:6800 即可查看
4、如果连接成功先关闭服务,自己在非C盘下新建一个文件夹,名称自定义如:scrapydTest
然后进入该文件夹,shift+右键 打开命令行工具,输入scrapyd执行,执行完成后会新建一个dbs空文件夹,用来存放爬虫项目的数据文件
5、安装scrapyd-client模块。scrapyd-client模块是专门打包scrapy爬虫项目到scrapyd服务中的,进入虚拟环境,执行命令pip install scrapyd-client==1.1.0,安装完成后,在虚拟环境的scripts中会出现scrapyd-deploy无后缀文件,这个scrapyd-deploy无后缀文件是启动文件,在Linux系统下可以运行,在windows下是不能运行的,所以我们需要编辑一下使其在windows可以运行
python分布式爬虫scrapyd部署以及gerapy的使用流程
最新推荐文章于 2024-05-10 13:28:18 发布