python 可视化界面_用python打造可视化爬虫监控系统,酷炫的图形化界面

原标题:用python打造可视化爬虫监控系统,酷炫的图形化界面

本文并不是讲解爬虫的相关技术实现的,而是从实用性的角度,将抓取并存入 MongoDB 的数据 用 InfluxDB 进行处理,而后又通过 Grafana 将爬虫抓取数据情况通过酷炫的图形化界面展示出来。

在开始之前,先对 Grafana 和 InfluxDB 做一下简要的介绍:

Grafana:是一个开源的分析和监控系统,拥有精美的web UI,支持多种图表,可以展示influxdb中存储的数据,并且有报警的功能。

**Influxdb **:是一款开源的时间序列数据库,专门用来存储和时间相关的数据(比如我用它存储某个时间点爬虫抓取信息的数量)。

最终能实现的效果是这样的:

5d8cdba7fda7418592084f957c8bb37a.jpeg

请注意以下操作,都是 Mac 下实现的。但是原理是相似的,你可以在自己的 PC 上进行试验。

2. 安装配置 InfluxDB

安装 InfluxDB

152e5af7510b45b1bb6e41d877ab272e.jpeg

修改配置文件/usr/local/etc/influxdb.conf,如果原文件中没有对应配置项,需自己添加。

982ca89dbb8b44be9bd0f33236c4dc83.jpeg

3. 安装配置 Grafana

安装 Grafana

fea942e5c9c741789bacdd1bc659a9d6.jpeg

并修改 Grafana 配置文件 /usr/local/etc/grafana/grafana.ini,内容如下:

9e074557efc64f20bdae2b248092509c.jpeg

4. 爬虫代码

由于这里主是要介绍如何将 Grafana 和 InfluxDB 与爬虫进行结合的方案,而不是主讲爬虫原理,而且代码也比较多,影响可读性,所以就不贴出爬取的代码。

5. 监控脚本

考虑到可能要增加爬虫到监控中,因此这里使用了热更新对监控进行动态配置。

配置文件 influx_settings.conf 主要用于热更新相关设置。

ff178e4bfb63481e9deb3b120d6fcc20.jpeg

如何动态读取这个配置文件的设置呢?需要写一个脚本来监控。代码如下:

cc39f3bce7c6455da72279624294ddd4.jpeg

3e3674feb9924a409328f50a7c80d546.jpeg

df0c80919f124e7e84713f3757eb9971.jpeg

9b60cd63423343f890f3769da68805de.jpeg

来试着运行一下

python3 influx_monitor.py

运行,得到下图内容,表示监控脚本运行成功。

22f7569f7bea4ae8a879bf4f12950d84.jpeg

另建窗口,修改配置文件 influx_settings.conf

# 修改间隔时间为8秒

interval = 8

切换至第一次运行 influxDB 的窗口,会提示配置更新,说明配置热更新生效。

6078e8c717d441dd9a8ceeb8b53692bf.jpeg

6. 配置 Grafana

首先打开 Chrome 浏览器,输入 http://127.0.0.1:3000 登录 grafana 页面。

连接本地 influxDB 数据库,操作如下图。

在红色方框内选择 Type 类型为 InfluxDB,并输入URL:http://localhost:8086

f5450f1bbc564604bd5fbf7a1fe6eadd.jpeg

1232acf9848143ef9d020e80cbc7ce8e.jpeg

在红框内输入influxDB数据库名称

新建 dashboard

b2c4dedfe3b64885987fe01305c127ca.jpeg

新建 graph 类型 dashboard

修改 dashboard 设置

0c5ecc79591946869a9daaf9ceea54c9.jpeg

点击红色方框修改设定

1b6df7544e0c4cbab0c4818e0bd413a8.jpeg

修改 dashboard 配置

设置监控的数据对象

在监控脚本中,写入influxDB的代码如下,其中 "measurement" 对应 表名,"fields" 对应写入的字段;

d2036191e7a0420d89540a2e65e0fa60.jpeg

7. 运行爬虫文件

启动 MongoDB 数据库服务。

brew services mongodb start

新建一个 terminal 窗口,运行爬虫文件。

5bce1c2cff64404ea6775b96dc53ef1b.jpeg

爬虫文件运行成功

我们可以在刚刚打开的控制台里查看效果展示:

5d8cdba7fda7418592084f957c8bb37a.jpeg

怎么样?学会了吗?如果你跟我一样都喜欢python,也在学习python的道路上奔跑,欢迎你加入python学习群:839383 765 群内每天都会分享最新业内资料,企业项目案例,分享python免费课程,共同交流学习,让学习变(编)成(程)一种习惯!返回搜狐,查看更多

责任编辑:

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值