python大学专业_Python爬虫爬取全国各大高校各专业分数

最新推荐文章于 2024-04-04 00:31:50 发布

weixin_39736379

最新推荐文章于 2024-04-04 00:31:50 发布

阅读量1.6k

点赞数

文章标签： python大学专业

该博客演示了如何使用Python爬虫获取全国高校2018年在天津的录取分数及各专业分数线。通过分析网络请求，抓取数据并使用requests库进行POST和GET操作，最终将数据整理并输出。

摘要由CSDN通过智能技术生成

本文仅练习爬虫程序的编写，并无保存任何数据，网址接口已经打码处理。

我们通过分析网络请求可以看到有这两个json文件：

https://xxx.cn/www/2.0/schoolprovinceindex/2018/318/12/1/1.json

https://xxx..cn/www/2.0/schoolspecialindex/2018/31/11/1/1.json

其中318是学校id，12是省份id，代表的是天津

分别对应着学校各省分数线以及和各专业分数线

因此我们当前页面的代码为：

import requests

HEADERS = {

"Accept": "text/html,application/xhtml+xml,application/xml;",

"Accept-Language": "zh-CN,zh;q=0.8",

"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:67.0) Gecko/20100101 Firefox/67.0",

'Referer': 'https://xxx.cn/school/search'

}

url = 'https://xxx.cn/www/2.0/schoolprovinceindex/2018/1217/12/1/1.json'

response = requests.get(url,headers=HEADERS)

print(response.json())

接下来我们就要想办法获取学校id了，同样我们分析到：

https://xxxl.cn/gkcx/api/?uri=apigkcx/api/school/hotlists

通过post如下数据：

data = {"access_token":"","admissions":"","central":"","department":"","dual_class":"","f211":"","f985":"","is_dual_class":"","keyword":"","page":2,"province_id":"","request_type":1,"school_type":"","size":20,"sort":"view_total","type":"","uri":"apigkcx/api/school/hotlists"}

我们可以看到一个参数是page，对应着页码：

所以我们这部分的代码为：

import requests

HEADERS &

最低0.47元/天解锁文章

weixin_39736379

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。