Python爬虫监控简介

一、监控的意义

爬虫脚本是基于网站的结构去写的,但是随着互联网的发展,很多公司的页面结构会发生变化,发生的变化就会导致我们写的爬虫失效,最主要的失效方式是xpath的失效。随着我们写的爬虫越来越多,越就越来越难以发现这些失效的脚本,导致数据更新失败,不及时,或者不满足抓取的质量和数量要求。这就需要对爬虫的脚本进行监控。
监控的目的是让数据及时的更新,脚本及时的发现bug以及解决bug。提高我们的工作效率。更好的保证线上数据产品的优质性。
我们需要介绍两种常见的监控方式:1、邮件 2、钉钉

二、Python邮件监控(SMTP)

1、SMTP简介
SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。
python的smtplib提供了一种很方便的途径发送电子邮件。它对smtp协议进行了简单的封装。

Python创建 SMTP 对象语法如下:
import smtplib
smtpObj = smtplib.SMTP( [host [, port [, local_hostname]]] )
参数说明:
host: SMTP 服务器主机。 你可以指定主机的ip地址或者域名如: runoob.com,这个是可选参数。
port: 如果你提供了 host 参数, 你需要指定 SMTP 服务使用的端口号,一般情况下 SMTP 端口号为25。
local_hostname: 如果 SMTP 在你的本机上,你只需要指定服务器地址为 localhost 即可。
Python SMTP 对象使用 sendmail 方法发送邮件,语法如下:
SMTP.sendmail(from_addr, to_addrs, msg[, mail_options, rcpt_options])
参数说明:
from_addr: 邮件发送者地址。
to_addrs: 字符串列表,邮件发送地址。
msg: 发送消息
这里要注意一下第三个参数,msg 是字符串,表示邮件。我们知道邮件一般由标题,发信人,收件人,邮件内容,附件等构成,发送邮件的时候,要注意 msg 的格式。这个格式就是 smtp 协议中定义的格式。

基于Python爬虫可以用于监控各种数据,包括疫情数据。通过使用Python爬虫技术,可以从特定的网站或API中获取最新的疫情数据,并将其保存到数据库中。 在监控疫情方面,可以使用Python爬虫定期获取最新的疫情数据,并将其存储到MySQL数据库中。这样,你就可以实时跟踪疫情数据的变化,并进行可视化展示。可以使用Flask框架构建一个Web项目,通过这个项目可以展示疫情数据的统计信息。 对于爬虫部分,你可以使用Python爬虫库,例如Beautiful Soup或Scrapy,来解析网页并提取疫情数据。接着,使用Python与MySQL数据库进行交互,将获取到的数据存储到数据库中。 在Web项目部分,使用Flask框架可以轻松地搭建一个后台,用于处理前端页面的请求,并将疫情数据从数据库中取出并呈现给用户。 最后,使用基于HTML5的Echarts库,可以将疫情数据可视化展示。Echarts提供了丰富的图表类型和交互功能,可以帮助你更好地理解和分析疫情数据。 使用这样的技术架构,你可以实现一个功能完善的疫情监控系统,能够获取最新的疫情数据,并通过可视化展示让用户更直观地了解疫情的情况。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Python疫情监控爬虫+可视化)](https://blog.csdn.net/dear__vip/article/details/108253520)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [python中turtle画酷炫图案-用python打造可视化爬虫监控系统,酷炫的图形化界面](https://blog.csdn.net/weixin_37988176/article/details/109424298)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值