Gerapy简介
基于Scrapy,Scrapyd,Scrapyd-Client,Scrapyd-API,Django和Vue.js的分布式爬虫管理框架。
Gerapy用法
1.通过pip安装Gerapy:
pip3 install gerapy
2.查看是否安装成功
$gerapy
成功信息
(env1) [root@nn18 ~]# gerapy
Usage: gerapy [-v] [-h] ...
Gerapy 0.9.6 - Distributed Crawler Management Framework
Optional arguments:
-v, --version Get version of Gerapy
-h, --help Show this help message and exit
Available commands:
init Init workspace, default to gerapy
initadmin Create default super user admin
runserver Start Gerapy server
migrate Migrate database
createsuperuser Create a custom superuser
makemigrations Generate migrations for database
generate Generate Scrapy code for configurable project
parse Parse project for debugging
loaddata Load data from configs
dumpdata Dump data to configs
3.初始化Gerapy
gerapy init
执行后会在当前目录下生成一个名字为gerapy的文件夹
cd gerapy
接着进入该文件夹下,可以看到project文件家说明初始化成功
4.初始化数据库
gerapy migrate
备注:此命令在gerapy目录下执行
会在gerapy目录下生成一个sqlite数据库,同时创建数据表
5.可以通过此命令运行server:
gerapy runserver
然后访问http://localhost:8000进入页面
或者可以这样配置主机和端口进行远程访问:
gerapy runserver 0.0.0.0:8888
如果遇到需要登录账号密码页面,但是没有设置的话,可以执行:
gerapy migrate
初始化数据库
gerapy createsuperuser
创建超级用户
输入Username:
Email:可以不用直接回车
Password: