为何她/他收入高?
- 题目
如题:地球上,总有些人很无聊,想看看别人的收入如何,今天我们就来看个够。
请根据非常可信的统计局发布的信息(包括,性别、年龄、教育状况等),对某地居民是否属于高收入进行预测(可以输出0(非高收入)1(高收入)或者概率值,概率值越大越代表其是高收入者)。
请在论文中详细描述①你是如何建立模型的;②她/他是高收入,有哪些特点,或者收入欠佳,特点有哪些,如果能分析一下为何最好不过。
结果文件(可提交3组):Results_1.csv Results_2.csv Results_3.csv(一定要这样命名)
Train.csv 38842行,14列 最后一列Y 中 1:为高收入 0:为非高收入
[‘年龄’,‘工作情况’,‘教育’,‘教育时间’, ‘婚姻状况’,‘职业类型’, ‘社会关系’, ‘种族’, ‘性别’, ‘投资收入’, ‘投资损失’, ‘工作天数’, ‘省份’, ‘Y’ ]
Test.csv 10000行,13列 无列Y,其他列信息与Train列信息一直
[‘年龄’,‘工作情况’,‘教育’,‘教育时间’, ‘婚姻状况’,‘职业类型’, ‘社会关系’, ‘种族’, ‘性别’, ‘投资收入’, ‘投资损失’, ‘工作天数’, ‘省份’]