使用 Python 爬取研究生官网最新公告通知并推送微信消息

效果

原理很简单,我只需要使用BeautifulSoup库每隔一段时间爬取一下官网网页的内容,然后把通知有关的信息存入一个数据库判断是不是新的通知就可以。如果是新的通知就使用虾推啥推送微信消息。效果如下:
dcd87e82e12c47e5225eb1aa9de272c.jpg

为了代码一直运行,所以我将它直接扔到服务器。让它一直跑着就行了。
image.png

代码

这里需要用到虾推啥,一行代码推送手机通知。
虾推啥官网教程链接
整体代码都比较简单易懂,小白也可以使用。
Python代码:

import pymysql
import requests
from bs4 import BeautifulSoup
import time
# 数据库信息自己填写
db_config = {
    'host': '***',
    'user': '**',
    'passwd': '***',
    'port': 3306,
    'db': '***',
    'charset': 'utf8'
}
db = pymysql.connect(**db_config)


def get_html(url):
    r = requests.get(url)
    r.encoding = "utf-8"
    if r.status_code != 200:
        raise Exception()
    return r.text


def parse_html(html_doc, element, class_name):
    soup = BeautifulSoup(html_doc, "html.parser")
    dev_nodes = soup.find_all(element, class_=class_name)
    return dev_nodes


def insert_into_db(title, url, date):
    cursor = db.cursor()
    sql = "SELECT * FROM notice WHERE title = %s"
    cursor.execute(sql, (title,))
    if not cursor.fetchone():
        sql = "INSERT INTO notice(title, content, date) VALUES (%s, %s, %s)"
        try:
            cursor.execute(sql, (title, url, date))
            db.commit()
        except:
            db.rollback()
            print("插入失败")


def is_new(title):
    cursor = db.cursor()
    sql = "SELECT * FROM notice WHERE title = %s"
    cursor.execute(sql, (title,))
    if not cursor.fetchone():
        return True
    return False


def send_message(title, url, date, stitute):
    mydata = {
        'text': stitute,
        'desp': '内容:' + title + '<br>' \
                                  '网址:' + '<a href="' + url + '">' + url + '</a>' + '<br>' \
                                                                                      '日期:' + date
    }
    requests.post('https://wx.xtuis.cn/您的token.send', data=mydata)
    # 注意这里要换成你自己的token

def CIE():
    url = "https://*****" # 这里要根据自己学校的官网填写,并且网页布局也不一样,获取元素逻辑不一样
    bs_url = "https://****"
    html_doc = get_html(url)
    dev_nodes = parse_html(html_doc, "li", "first")
    title = dev_nodes[0].find("a").get_text().strip()
    date = dev_nodes[0].find("span").get_text()
    to_url = bs_url + dev_nodes[0].find("a")["href"]
    # 上面几行都是获取页面元素的逻辑,要根据实际情况修改。
    if is_new(title):
        print("信息工程学院官网有新公告!")
        insert_into_db(title, to_url, date)
        send_message(title, to_url, date, "信息工程学院官网有新公告!")
    else:
        print("无新公告!")


def GraduateSchool():
    url = "https://****" # 同上
    bs_url = "https://***"
    html_doc = get_html(url)
    dev_nodes = parse_html(html_doc, "a", "tit")
    title = dev_nodes[0].get_text()
    content = bs_url + dev_nodes[0]['href']
    date = parse_html(html_doc, 'li', "first")[0].get_text()
    if is_new(title):
        print("研究生学院官网有新公告!!")
        insert_into_db(title, content, date)
        send_message(title, content, date, "研究生学院官网有新公告!")
    else:
        print("无新公告!")


while True:
    CIE()
    GraduateSchool()
    print("目前时间:", time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))
    time.sleep(60 * 5)

注意根据自己的实际情况修改代码中自己的参数。

  • 8
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

万伏小太阳

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值