用Python Django 快速撸一个爬虫管理后台

wangnan229

已于 2023-09-01 09:27:19 修改

阅读量842

点赞数 1

文章标签： python django 开发语言

于 2023-06-02 00:28:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangnan229/article/details/130998359

版权

用Django 快速撸一个爬虫管理后台

简介:

基于Django的admin后台，将之前写的一个爬虫集成到项目当中，爬虫抓取公司信息，存表，web端展示与调度管理，使用账号登陆认证。如果只是完成数据web展示跟调度的话，前端我觉着完全可以不写，只用admin（太懒了是吧，实际原因是前端是目前知识盲区而已~~）
组件：Python3.10 + Django3 + Celery

特点:

web端管理:在web端定时调度，并且可以手动启动,停止

页面设计:

首页: 是展示数据的页面，①按各爬虫模块，分别展示最近更新数据的企业列表。指标：公司总数及增长率、
调度管理页: 查看正在运行的调度
爬虫配置页: 配置爬虫参数，比如运行需要的cookie，数据库等。

难点:

调度管理页面模板的设计与开发，其中已经借用了admin、flower的管理后台，未实现的是爬取记录的实时获取
调度管理交互相关的后台，页面开发。

主要页面展示：

![在这里插入图片描述](https://img-blog.csdnimg.cn/de58fdb472d543bdaa72b7d6626dd1d4.png## 简单总结
这是可以作为一个练手的小项目，代码结构很简单，但也是有些实用的地方，比如你可以爬虫任务在跑着，然后刷新页面后出现抓取的最新时间倒序排的数据，还是感觉不错。
接下来，我们每天定时调度后产生数据，不能让他们静静的躺在数据库里了，得ETL，得分析，这是后面要写的了。今天收工先。

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。