scrapy可视化管理工具spiderkeeper使用笔记

本文介绍了如何使用SpiderKeeper这款开源的Scrapy爬虫管理工具进行爬虫的部署、启动、暂停和定时任务设置。通过配置scrapy.cfg文件,将项目部署到Scrapyd,再上传到SpiderKeeper,实现对爬虫的可视化管理。SpiderKeeper提供Dashboard、Periodic Jobs、Running Stats和Manage等模块,便于监控和控制爬虫状态。
摘要由CSDN通过智能技术生成

spiderkeeper是一款开源的spider管理工具,可以方便的进行爬虫的启动,暂停,定时,同时可以查看分布式情况下所有爬虫日志,查看爬虫执行情况等功能。

#安装
安装环境
ubuntu16.04
python3.5
pip3 install scrapy
pip3 install scrapyd
pip3 install scrapyd-client
pip3 install scrapy-redis
pip3 install SpiderKeeper

部署爬虫

##1 进入到写好的scrapy项目路径中,启动scrapyd

python@ubuntu:~$ scrapyd

启动之后就可以打开本地运行的scrapyd,浏览器中访问本地6800端口可以查看scrapyd的监控界面
这里写图片描述
启动成功显示如下:

:0: UserWarning: You do not have a working installation of the service_identity module: 'cannot import name 'opentype''.  Please install it from <https://pypi.python.org/pypi/service_identity> and make sure all of its dependencies are satisfied.  Without the service_identity module, Twisted can perform only rudimentary TLS client hostname verification.  Many valid certificate/hostname mappings may be rejected.
2018-08-18T18:55:20+0800 [-] Loading /usr/local/lib/python3.5/dist-packages/scrapyd/txapp.py...
2018-08-18T18:55:20+0800 [-] Scrapyd web console available at http://127.0.0.1:6800/
2018-08-18T18:55:20&#
  • 1
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
Python是一种高级编程语言,而Django和Scrapy是Python的两个流行的库。这些库都可以用于构建Web应用程序和爬虫。 首先,Python是一种易学易用的编程语言,它具有简洁的语法和强大的功能,非常适合初学者和专业开发人员。它在许多领域都有广泛的应用,包括Web开发、数据分析和人工智能等。 然后,Django是一个基于Python的开发框架,它提供了一系列的工具和组件,使开发Web应用程序变得更加简单和高效。使用Django可以快速构建安全、可扩展和易维护的Web应用程序。它提供了强大的ORM(对象-关系映射)功能,可以使用Python代码来操作数据库。 最后,Scrapy是一个强大的Python爬虫框架,用于抓取和提取互联网上的数据。它提供了简单易用的API和丰富的功能集,可用于构建高性能的网络爬虫。Scrapy支持异步并发请求,具有自动重试和错误处理等功能。它还提供了强大的数据提取功能,可以将爬取的数据存储到数据库或导出为不同的格式。 为了可视化Python、Django和Scrapy,可以使用各种库和工具。例如,可以使用Matplotlib、Seaborn和Plotly等库创建各种图表来展示数据。此外,可以使用Django的模板语言和前端框架如Bootstrap来设计和构建用户界面。还可以使用Django的内置管理界面来可视化管理数据库中的数据。 总之,Python、Django和Scrapy是强大的工具和库,可以用于开发Web应用程序和爬虫。通过使用适当的可视化库和技术,可以为这些应用程序创建出色的可视化效果,使用户能够更好地理解和分析数据。
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值