一、背景交代
本人破厂铁杆,上周刚被红军血虐,并且主队上赛季战绩不佳,无缘欧冠,实在心如死灰(手动捂脸)。
这次也用RCurl来尝试爬取一下英超联赛的所有比分,选取赛季为16-17赛季。
选择的网站不是大家平时关注多的一些门户网站,而是一家香港的专业足球网站(实时滚球加持buff),
网址为:http://data.7m.cn/database/index_big.htm ,页面如下:
二、对象定位
1、 一般基本的爬虫通过html页面或者解析json去爬取得到所需数据,但是这个网站无法右键查看源代码和检查。利用浏览器快捷键 ctr+shift+I 直接进入检查界面。
2、 接下来轻车熟路,找到JS,F5刷新,发现第二个fixgure.js就是要找的数据。
3、双击fixgure.js,跳转到数据所在的页面,得到网址:
http://data.7m.cn/history_matches_data/2016-2017/92/big/fixture.js