Python爬虫实战（二）教务处首页

最新推荐文章于 2022-10-08 23:44:34 发布

Panda325

最新推荐文章于 2022-10-08 23:44:34 发布

阅读量513

点赞数

分类专栏： Python爬虫文章标签： python

本文链接：https://blog.csdn.net/Panda325/article/details/108073564

版权

该博客分享了如何使用Python爬虫爬取四川大学教务处首页的通知信息，并通过邮件进行推送。主要包括两个部分：`crawl.py`负责获取页面响应并解析数据，`send_email.py`则利用库实现实时邮件通知功能。

摘要由CSDN通过智能技术生成

功能

爬取四川大学教务处首页的通知，并邮件推送

github链接：https://github.com/ZhengLin-Li/leaning-spider-scu-jwc

思路

一、crawl.py

利用requests库,拿到页面的response对象
利用BeautifulSoup库解析拿到的文档树
把数据文件保存进data.txt文件中

二、send_email.py

引入SMTP,Header,MIMEText库
利用固定格式发送电子邮件

实现

import requests
from bs4 import BeautifulSoup

response = requests.get('http://jwc.scu.edu.cn/')
page = response.content.decode()
# print(page)

soup = BeautifulSoup(page, 'lxml')
tag = soup.find_all(class_='list-llb-list')
# print(tag)

result = ''
for each in tag:
    result += each.text
# print(result)

with open('data.txt', 'w