集成学习下 03幸福感预测实战

本文介绍了一个基于集成学习的幸福感预测项目。首先,对包含139个离散特征的数据集进行清洗,处理异常值和缺失值。然后进行特征工程,包括数据增广和one-hot编码。接着,使用lightgbm、xgboost、随机森林、梯度提升决策树和极端随机森林回归等模型进行特征建模,并通过stacking集成。最终,通过调整特征和模型,通过stacking获得0.4494572856014824的预测结果。
摘要由CSDN通过智能技术生成

集成学习下 03幸福感预测实战

项目和代码开源地址:datawhale

1. 赛题思路

  • 首先分析变量维数和特征,赛题变量维数139维,均为离散变量/特征。对训练集中数据进行清洗,根据不同变量对应index的值,进行异常值的去除、补充缺失值、修改错误值的操作。如下所示:
#填充缺失值 共25列 去掉4列 填充21列
#以下的列都是缺省的,视情况填补
data['work_status'] = data['work_status'].fillna(9)#修改为其他
data['work_yr'] = data['work_yr'].fillna(0)
data['work_manage'] = data['work_manage'].fillna(0)
data['work_type'] = data['work_type'].fillna(0)

data['edu_yr'] = data['edu_yr'].fillna(0)
data['edu_status'] = data['edu_status'].fillna(0)

data['s_work_type'] = data['s_work_type'].fillna(0)
data['s_work_status'] = data['s_work_status'].fillna(9)#修改其他
data['s_political'] = data['s_political'].fillna(0)
data['s_hukou'] = data['s_hukou'].fillna(8)
data['s_income'] = data['s_income'].fillna(0)
data['s_birth'] = data['s_birth'].fillna(0)
data['s_edu'] = data['s_edu'].fillna(14)
data['s_work_exper'] = data['s_work_exper'].fillna(0)

data['minor_child'] = data['minor_child'].fillna(0)
data['marital_now'] = data['marital_now'].fillna(0)
data['marital_1st'] = data['marital_1st'].fillna(0)
data['social_neighbor']
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值