目录
1.导入模块
2.Pandas预处理数据:
2.1合并6份考研数据120000条+
2.3数据去重
2.4数据去空
2.5数据筛选
3.绘制图形:
3.1统计每个学校有多少个专业前十名并绘制柱状图
3.2 筛选计算机科学与技术专业收分最高的前十所学校及分数
3.3 筛选软件工程专业收分最高的前十所学校及分数
4.根据统计数量绘制词云图:
4.1生成学校词云图
4.2生成专业词云图
5.统计每个专业的最高分最低分和平均分:
6.统计地区大学数量占比:绘制饼状图
7.数据再分析:
7.1各省份本专科占比:直方图对比
7.2各省份本专科占比:直方图对比
7.3不同大学类型占比:饼状图
8.1数据建模
8.1建模前数据预处理
8.2建模前测试
8.3建立K-means模型
8.4模型评估
原创百度网盘资源:
链接:https://pan.baidu.com/s/1c_-RMjerTSw4NY85lrB6rQ?pwd=py66
说明:转载请标明出处