前几天闲来无事,看到了一个羊毛线报网站,发现每日都在更新一些比较好的内容,比如领券、云盘、加油优惠、免费会员等一手信息,自己按照操作还撸了不少的优惠,但是每天手动打开这个网站还是挺麻烦的,主要有两点功能。
- 自动抓取最新的羊毛日报信息
- 将获取到的信息自动发送到邮箱
这样利用每天上班在地铁上的时间,就可以阅览下信息,如果有价值就可以直接操作了,非常的方便!
代码地址
- https://github.com/AnTi-anti/Python_Demo
思路
抓取内容
虽然网页有很多优惠信息,但是并不是所有的信息都值得被推送,比如有些过期了的优惠活动,这里我默认抓取前五条时间最新的信息,如果你有需求,也可以自己修改。
网页的元素也是简单到不能再简单了,没有反爬,也不需要登录。
所有的信息都在下面这个li标签中
liTags = soup.find_all('li',<