(一)
时间:2022.11.25
缺失值处理:无
异常值处理: 使用岭回归(Rigde)预测异常点,其中
阈值sigma=1,最终删除699条数据
特征工程:使用ked分布图,主观认为应该删除3个特征
使用相关系数,删除相关系数小于0.2的特征,最终删除18个特征
因为删除了许多的异常点,所以数据使用归一化,也方便后续的boxcox正态变换
boxcox正态变换
模型选择:Lass回归
参数设置:
parameters={}
SVR回归
参数设置:
parameters={‘C’: 100, ‘gamma’:0.1}
XGB回归
参数设置:
parameters={‘learning_rate’: 0.1, ‘n_estimators’: 200, ‘max_depth’: 3, ‘min_child_weight’: 1, ‘seed’: 0, ‘subsample’: 0.8, ‘colsample_bytree’: 0.8, ‘gamma’: 0.01, ‘reg_alpha’: 0, ‘reg_lambda’: 1}
模型融合:0:4:1
最终得分: 0.22