算法选择--模型融合

  关于模型融合,方法依旧在网上有一大堆,近几年也没有太大的创新,
  主要说一下的就是模型融合前应该画一画误差曲线,确定模型之间是否有融合的需要,比如一个模型完爆另外一个模型,那融合价值就很低。

kaggle ensembling guide(Kaggle中常用融合技术 )

  计算了我们所有提交的皮尔逊相关系数,然后选择一些表现好但又相互不太相关的模型。通过多个结果的平均融合,我们获得了50名的进步。不相关的结果明显比相关的结果融合得来的要好。

  1)平均
  平均在一系列任务上有重要的作用。在分类和回归中,以及在不同的度量中如AUC,均方误差,和对数损失中都有重要作用。
  平均可以减少过拟合。你希望在两个类之间获得一个平滑的分割平面。但是一个单一的模型的预测结果在边界上可能是粗糙的。

  2)排序平均
  有时候平均多个模型可能会有一些问题。不是所有的预测模型都能够完美的标准化。有时候预测的结果可能会在低概率和高概率处过于集中,或者集中再一个比较小的范围内。
  当与其他模型融合的时候它可能根本不会改变融合的结果。我们的策略是先把预测转换为排名,然后平均他们的排序。然后将平均后的结果规范化到0,1区间内,你就能够获得一个平滑的预测。

  3)特征加权线性堆叠
  特征加权线性堆叠利用模型的预测结果堆积工程化的原始特征。这样做的目的是为堆积模型中的基本模型学习一个确定的特征值。线性算法用来保证获得结果迅速和简单。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值