介绍
Gerapy 是一款分布式爬虫管理框架,支持 Python 3,基于 Scrapy、Scrapyd、Scrapyd-Client、Scrapy-Redis、Scrapyd-API、Scrapy-Splash、Jinjia2、Django、Vue.js 开发,Gerapy 可以帮助我们:
更方便地控制爬虫运行
更直观地查看爬虫状态
更实时地查看爬取结果
更简单地实现项目部署
更统一地实现主机管理
更轻松地编写爬虫代码
安装与配置
pip install gerapy # 安装
gerapy # 查看是否安装成功
gerapy init # 执行后会在当前目录下生成一个名字为gerapy的文件夹
cd gerapy # 接着进入该文件夹下,可以看到project文件家说明初始化成功
gerapy migrate # 此命令在gerapy目录下执行,会在gerapy目录下生成一个sqlite数据库,同时创建数据表
gerapy createsuperuser # 创建超级用户 之后就是输入Username, Email,Password
使用
gerapy runserver 127.0.0.1:8000 # 默认是本地化启动,如果端口被占用请自行更改
浏览器访问 http://127.0.0.1:8000/