准备工作:
1.“雷丁学姐”给我的,10年收集的学生申请数据,以Excel的数据作为整理。
2.Pytho 3.6本人使用Anaconda (数据包比较全)
基本实现方法:
学生数据解析,因为“雷丁学姐”在整理学生的资料过程中,学生的相关信息过于复杂有很多的维度,需要提取主要的信息,学生的维度有,1)大学在国内的排名,2)大学是否是985,3)或者211,4)学生的支付信用,5)学生的实习经历,6)学生是否参见了学校活动,7)学生是否在主要学科中获得了比较高的成绩,8)学生在于研究生课程相关的课程中是否获得好成绩,8)学生的雅思成绩。9)推荐文书的是由那个老师执笔的
经过筛选“雷丁学姐”,案例中这1万名学生的成绩发现,学校看重的几点
1)雅思成绩是硬性要求
2)文书老师决定了学校的申请的成功率
3)学生的在校成绩是对申请的很有影响的
己过这些分析我们基本得到了,每个专业的某分数的入取概率,
具体信息可以看着个视频
https://v.qq.com/x/page/c091617pspe.html
算法采用机器学习,来学习这些变量与录取率的关系
最终应用到“雷丁学姐”的研究生申请中