程序本身没有什么难的。
目的是从中国天气网获取天气。
经过分析,每个城市天气页面的url大概如下。
http://www.weather.com.cn/weather/101180101.shtml
其他部分都一样,其中,“101180101”,只有代表城市的数字不一样,一个城市一个编码。
本来还想整个网站爬取遍历,后面发现有人已经把城市对应的编码整理好了。
于是找了这么一个txt文件,文件里的内容大概是这个样子
101010100=北京
101010200=海淀
101010300=朝阳
101010400=顺义
101010500=怀柔
101010600=通州
....