(本文数据为实验用例)
一、背景
母亲是老师反而会对孩子的学习成绩造成不利影响?能上网的家庭,孩子通常能取得较好的成绩?影响孩子成绩的最大因素居然是母亲的学历?本文通过机器挖掘算法和中学真实的学生数据为您揭秘影响中学生学业的关键因素有哪些。
本文的数据采集于某中学在校生的家庭背景数据以及在校行为数据。通过逻辑回归算法生成离线模型和学业指标评估报告,并且可以对学生的期末成绩进行预测。
二、数据集介绍
数据集由25个特征和一个打标数据构成,
具体字段如下:
字段名
含义
类型
描述
sex
性别
string
F是女,M表示男
address
住址
string
U表示城市,R表示乡村
famsize
家庭成员数
string
LE3表示少于三人,GT3多于三人
pstatus
是否与父母住在一起
string
T住在一起,A分开
medu
母亲的文化水平
string
从0~4逐步增高
fedu
父亲的文化水平
string
从0~4逐步增高
mjob
母亲的工作
string
分为教师相关、健康相关、服务业
fjob
父亲的工作
string
分为教师相关、健康相关、服务业
guardi