R语言一键爬取英格兰足球超级联赛16-17赛季所有比分(基于RCurl)

本文介绍了如何使用R语言的RCurl库爬取香港专业足球网站上的16-17赛季英超联赛比分数据。通过分析网页的JS文件,找到数据来源,然后编写代码解析并获取数据,最终保存为CSV文件,为后续的足球数据分析提供素材。
摘要由CSDN通过智能技术生成

一、背景交代

本人破厂铁杆,上周刚被红军血虐,并且主队上赛季战绩不佳,无缘欧冠,实在心如死灰(手动捂脸)。
这次也用RCurl来尝试爬取一下英超联赛的所有比分,选取赛季为16-17赛季。
选择的网站不是大家平时关注多的一些门户网站,而是一家香港的专业足球网站(实时滚球加持buff),
网址为:http://data.7m.cn/database/index_big.htm ,页面如下:

这里写图片描述

二、对象定位

1、 一般基本的爬虫通过html页面或者解析json去爬取得到所需数据,但是这个网站无法右键查看源代码和检查。利用浏览器快捷键 ctr+shift+I 直接进入检查界面。

2、 接下来轻车熟路,找到JS,F5刷新,发现第二个fixgure.js就是要找的数据。

这里写图片描述

3、双击fixgure.js,跳转到数据所在的页面,得到网址:
http://data.7m.cn/history_matches_data/2016-2017/92/big/fixture.js

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值