24考研数据爬取-可视化大屏-动态页面【数据分析】

在这里插入图片描述

24考研数据爬取-可视化大屏-动态页面

介绍:

基于 python3.9 + flask + echarts 的23考研数据爬取与可视化大屏展示

目的:

针对24年研招网收录的招生单位、院系所、专业、研究方向、考试方式、考试科目、招录人数、指导老师、备注等信息进行爬取、清洗和可视化分析。

准备:

1.找到想要爬取的网站(https://yz.chsi.com.cn/zsml/queryAction.do

image.png

2.分析网站的HTML结构,以及规划想要爬取的信息

image.png

image.png

搭建/运行

1. 环境

Python3.9+各种库

2. 数据爬取

使用的是 selenium4.2.0 版本的API,可降版本或者改方法/参数

3. 数据分析+可视化大屏
  • 可视化大屏

运行:

  • 运行app.py:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vEiq97SK-1686900668965)(C:\Users\ada\AppData\Roaming\Typora\typora-user-images\image-20230616113011482.png)]

  • 以浏览器的方式打开index.html:

在这里插入图片描述

结果【如果网页显示发生错误,先确保app.py在运行,然后重新打开html】:

在这里插入图片描述

4. 单个模块可视化
  • 词云

运行该py文件:

在这里插入图片描述

结果:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wGWKOVPN-1686900479023)(https://foruda.gitee.com/images/1686896865672427369/5f3c1a8e_10238196.png "屏幕截图")]

  • 英语和数学柱状图

运行:

在这里插入图片描述

结果:

在这里插入图片描述

  • 人数分布饼状图

运行:

在这里插入图片描述

结果:

在这里插入图片描述

    1. 院校数柱状图

运行:

在这里插入图片描述

结果:

在这里插入图片描述

  • 地图

运行生成地图.html,不要运行html,这是一个根据数据生成的html,直接在用浏览器打开即可:

在这里插入图片描述

结果:
如可视化大屏所示。

项目详情 https://github.com/yizhishiliu/bigData

  • 2
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
以下是使用Python考研数据的示例代码: ```python import requests from bs4 import BeautifulSoup # 设置请求头信息 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 构造请求链接 url = 'https://yz.chsi.com.cn/zsml/queryAction.do' params = { 'm': 'search', 'yxmc': '', # 学校名称 'zymc': '', # 专业名称 'xxfs': '', # 学习方式 'pageno': 1 # 页码 } # 发送请求,并获数据 response = requests.get(url, params=params, headers=headers) soup = BeautifulSoup(response.text, 'html.parser') table = soup.find('table', {'class': 'ch-table'}) rows = table.find_all('tr') # 解析数据 for row in rows: cols = row.find_all('td') if len(cols) == 10: # 数据行 school = cols[0].text.strip() # 学校名称 major = cols[1].text.strip() # 专业名称 category = cols[2].text.strip() # 学科门类 degree = cols[3].text.strip() # 学位类型 study_type = cols[4].text.strip() # 学习方式 year = cols[5].text.strip() # 招生年份 batch = cols[6].text.strip() # 批次 province = cols[7].text.strip() # 省份 plan_num = cols[8].text.strip() # 计划数 enroll_num = cols[9].text.strip() # 报名数 print(school, major, category, degree, study_type, year, batch, province, plan_num, enroll_num) ``` 该代码使用requests库发送HTTP请求,并使用BeautifulSoup库解析HTML页面,最终获考研数据并输出。你可以根据自己的需求修改请求链接和解析逻辑。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值