前些日子,同事的孩子参加高考,知道分数后让我帮忙参考报学校,作为一个已过不惑之年的油腻大叔,远离学校已经16年了,各个高校在我省得录取批次、人数、分数(位次)一无所知,幸亏有无所不知的互联网,但是全国几千家高校,一个一个查起来太难了,就想如果有个excel表格记录全国高校在我省得录取情况,我就可以根据分数(位次)从容的选出能够报考的学校。郁闷的是这个数据没有。我从2021年的3月开始基础python,这几天刚好自学到爬虫这一部分,我就想能不能从网络上爬取这些数据。查找网络,有https://gkcx.eol.cn/(中国教育在线),在学校——历年分数页面有我所需要的数据,具体如下:
黑色圈住的数据就是我需要的。
一、看到了上面的数据,但是还有一个前提条件,找到全国所有的学校,这个也好查找,图片如下:
看一下,全国所有的高校有143页,接下来我要做的就是看这些数据的真实来源,只有通过浏览器中的开发真工具,最好用谷歌浏览器,按F12,通过仔细观察,我发现 这些数据的真实来源于网页中的json ,真实网址应该是https://api.eol.cn/gkcx/api/?access_token=&admissions=¢ral