24考研数据爬取-可视化大屏-动态页面
介绍:
基于 python3.9 + flask + echarts 的23考研数据爬取与可视化大屏展示
目的:
针对24年研招网收录的招生单位、院系所、专业、研究方向、考试方式、考试科目、招录人数、指导老师、备注等信息进行爬取、清洗和可视化分析。
准备:
1.找到想要爬取的网站(https://yz.chsi.com.cn/zsml/queryAction.do)
2.分析网站的HTML结构,以及规划想要爬取的信息
搭建/运行
1. 环境
Python3.9+各种库
2. 数据爬取
使用的是 selenium4.2.0 版本的API,可降版本或者改方法/参数
3. 数据分析+可视化大屏
- 可视化大屏
运行:
- 运行app.py:
- 以浏览器的方式打开index.html:
结果【如果网页显示发生错误,先确保app.py在运行,然后重新打开html】:
4. 单个模块可视化
- 词云
运行该py文件:
结果:
- 英语和数学柱状图
运行:
结果:
- 人数分布饼状图
运行:
结果:
-
- 院校数柱状图
运行:
结果:
- 地图
运行生成地图.html,不要运行html,这是一个根据数据生成的html,直接在用浏览器打开即可:
结果:
如可视化大屏所示。