灵感触发:
1.最近学了点python爬虫,觉得挺有意思。
2.这几天天气不稳定,有时早上以为不会下雨就不带伞,结果回来的时候下大雨。(广东的天气,跟女生的心一样猜不透-。-)
3.懒得特意去查天气预报
于是乎,决定用python爬取第二天的天气,如果下雨,服务器发送邮件给我(微信能接受QQ邮箱,这样能及时看到这个消息
爬取天气:
思路:找个稳定的网站,保证网站的url不会变,里面的信息是我学的那一点爬虫技巧能爬的。(我看过一些文章里面直接用API,但这类API很多都不稳定或者说收费的,比较了一下,爬这个简单的数据估计比用API还简单,稳定)。
经过一番查找,决定爬这个网页http://www.weather.com.cn/weather/101280101.shtml
用开发者工具确认位置后,去源代码页面看看(这种每天更新的页面,要么只在需要更新的地方使用动态获取,要么就是把网页写死,更新的时候直接把整个网页文本更换)
从源代码直接看到信息,说明是后者,这意味着这个爬虫简直不要太好写。
<