功能
爬取四川大学教务处首页的通知,并邮件推送
github链接:https://github.com/ZhengLin-Li/leaning-spider-scu-jwc
思路
一、crawl.py
- 利用
requests
库,拿到页面的response对象 - 利用
BeautifulSoup
库解析拿到的文档树 - 把数据文件保存进
data.txt
文件中
二、send_email.py
- 引入
SMTP
,Header
,MIMEText
库 - 利用固定格式发送电子邮件
实现
import requests
from bs4 import BeautifulSoup
response = requests.get('http://jwc.scu.edu.cn/')
page = response.content.decode()
# print(page)
soup = BeautifulSoup(page, 'lxml')
tag = soup.find_all(class_='list-llb-list')
# print(tag)
result = ''
for each in tag:
result += each.text
# print(result)
with open('data.txt', 'w