天池大赛 工业蒸汽量学习赛记录

(一)

时间:2022.11.25
缺失值处理:无
异常值处理: 使用岭回归(Rigde)预测异常点,其中
         阈值sigma=1,最终删除699条数据
特征工程:使用ked分布图,主观认为应该删除3个特征
     使用相关系数,删除
相关系数小于0.2
的特征,最终删除18个特征
     因为删除了许多的异常点,所以数据使用归一化,也方便后续的boxcox正态变换
     boxcox正态变换
模型选择Lass回归
          参数设置:
               parameters={}
     SVR回归
          参数设置:
               parameters={‘C’: 100, ‘gamma’:0.1}
     XGB回归
          参数设置:
               parameters={‘learning_rate’: 0.1, ‘n_estimators’: 200, ‘max_depth’: 3, ‘min_child_weight’: 1, ‘seed’: 0, ‘subsample’: 0.8, ‘colsample_bytree’: 0.8, ‘gamma’: 0.01, ‘reg_alpha’: 0, ‘reg_lambda’: 1}
模型融合:0:4:1
最终得分: 0.22

总结:分数进步空间很大。感觉特征删的太多了 虽然相关系数0.2是挺小的,但是如果删除一半的相关系数小于0.2的特征,对最终的预测终究会积少成多从而造成较大影响

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值