python攻击校园网_Python--校园网爬虫记

最新推荐文章于 2024-07-25 10:00:00 发布

sMrZhao

最新推荐文章于 2024-07-25 10:00:00 发布

阅读量1.5k

点赞数 2

文章标签： python攻击校园网

本文链接：https://blog.csdn.net/weixin_31600439/article/details/112013541

版权

本文讲述了如何使用Python爬虫自动化地登录校园网并获取成绩。首先分析了请求流程，包括登陆后的Get和Post请求，利用Requests库和BeautifulSoup解析HTML。接着展示了代码实现，包括登录、获取数据和写入Excel。最后提到了使用Selenium自动化测试框架的另一种慢速但直观的方法。

摘要由CSDN通过智能技术生成

查成绩，算分数，每年的综合测评都是个固定的过程，作为软件开发者，这些过程当然可以交给代码去做，通过脚本进行网络请求获取数据，然后直接进行计算得到基础分直接填表就好了，查成绩再手动计算既容易出错也繁琐，所以本篇的内容就是开发一个爬虫脚本取抓取成绩表，至于综合测评计算，这个没什么意义这里就不说了，分数都有了就都够了。

我们的目的就是通过编写脚本，模仿浏览器进行请求获取源码，再进行解析本地化(或者直接计算)

要抓取到数据，其实方案不止一种，这里会介绍两种不同的方案，达到同样的目的：

模仿浏览器进行请求(速度快)

操作浏览器进行请求(速度慢)

先说第一种，这种方案是普遍的爬虫技术，因为爬取的内容不多，对速度要求也不够，所以就是很简单的一个爬虫过程：

分析请求

模仿请求

对于普通的校园网，一般不做流量限制，所以就算请求频繁，也基本不用担心IP被封禁，所以编写爬虫代码可以不用太过担心。先说我所在学校的校园网，是杭州方正软件公司开发的。

① 分析请求

分析请求很简单，就是使用浏览器进行请求，然后分析每个请求所发送和接收的信息，这里最简单应该是使用chrome的开发者模式(F12打开)

输入用户名和密码，勾选已认真阅读，接着点击登陆，这样右边的网络窗口中会检查到所有的网络请求，我们只需要找到对应登陆的一个(这里会带有表单)：

这个时候，我们可以通过一些测试工具，尝试进行请求对应的这个地址，并且把表单提交上去试试登陆能否成功，如果成功的话，脚本也就可以模拟这个请求，这里用的是chrome商店的一个工具Postman，用法很简单：