2).我们用chrome浏览器,分析一下网站的结构和源码
访问:
http://kaijiang.zhcw.com/zhcw/inc/3d/3d_wqhg.jsp
跳转到:
http://kaijiang.zhcw.com/zhcw/html/3d/list.html
访问:
http://kaijiang.zhcw.com/zhcw/inc/3d/3d_wqhg.jsp
跳转到:
http://kaijiang.zhcw.com/zhcw/html/3d/list.html
经过观察和分析,开奖数据链接很规律,如下:
第一页:
http://kaijiang.zhcw.com/zhcw/html/3d/list_1.html
最后一页:
http://kaijiang.zhcw.com/zhcw/html/3d/list_230.html
第一页:
http://kaijiang.zhcw.com/zhcw/html/3d/list_1.html
最后一页:
http://kaijiang.zhcw.com/zhcw/html/3d/list_230.html
3).页面分析结果
经过对开奖数据页面分析,总共有230页,链接也很规律
思路为从开奖数据页面抓取开奖日期、开奖期数及开奖号码等数据
然后循环处理每一页,最后将数据写入execl表格即可
经过对开奖数据页面分析,总共有230页,