本文以学生的数据集为基础,利用python通过对学生的性别国籍以及课堂表现等数据进行分析,了解学生情况以及对学生的成绩进行预测。
数据来源
gender:性别;NationalITy:国籍;PlaceofBirth:出生地;StageID:级别;GradeID:年级;SectionID:班级;Topic:学科;Semester:学期;Relation:家庭关系;raisedhands:课堂举手次数;VisITedResources:浏览在线课件次数;AnnouncementsView:浏览学校公告次数;Discussion:课堂讨论次数;ParentAnsweringSurvey:家长是否填写问卷;ParentschoolSatisfaction:家长对学校满意度;StudentAbsenceDays:学生缺勤次数;Class:等级(成绩),分为L(low)、M(middle)、H(high)。
定义问题
本次分析,研究学生成绩与什么因素有关,并进行预测。
数据清洗
查看空值
数据比较没有空值异常值,数据干净不需要清洗。
数据探索EDA
数据集等级(分数)分布状况
数据集结果没有不平衡.
分析影响因素
1.性别gender