Datawhale模型融合

模型融合类型方式:

       1、简单加权融合:

               回归(分类概率):算术平均融合,几何平均融合

               分类:投票

               综合:排序融合,log融合

        2、stacking/blending

                构建多层模型,并利用预测结果再拟合

        3、boosting/bagging

                多树得提升方法

 

2)什么是stacking?

简单来说stacking就是利用初始训练数据学习出若干和学习器,将这几个学习器预测得结果作为新得训练集,

来学习一个新的学习器。

3)模型说明

         1、次级模型尽量选择简单得线性模型。

          2、利用K折进行交叉验证

 

代码示例:

   1)简单得加权平均,结果直接融合

 

   2)特殊加权融合形式,mean平均,median平均:

stacking融合(回归):

可以发现模型结果相对于之前有进一步的提升,这是我们需要注意的一点是,对于第二层Stacking的模型不宜选取的过于复杂,这样会导致模型在训练集上过拟合,从而使得在测试集上并不能达到很好的效果。

分类模型融合

    1)Voting投片机制

          voting分为软投票和硬投票,原理采用少数服从多数得思想。

from  sklearn.ensemble import VotingClassifier

软投票:

 

经验总结:

    1)结果层面得融合,有一个重要得条件就是模型得分比较近似,然后结果得差异要比较大,这样得结果融合往往有比较号得效益提升。

    2)特征层面得融合,主要是将特征进行分割给不同得模型,然后进行预测,这样得结果有时产生比较好的结果。

    3)模型层面的融合,部分模型的结果作为特征输入等,常用树模型等集成模型后面加个LR或者线性模型。最好模型层面的融合最好不同类型,有一定的差异/同种模型最好不同参数或者不同特征。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Datawhale Excel是一个由Datawhale(鲸准教育)团队开发的一套用于数据分析和处理的工具。Excel是一款常用的办公软件,而Datawhale Excel在Excel的基础上进行了二次开发和优化,拥有更强大的数据处理和分析能力。 Datawhale Excel提供了丰富的数据处理和分析功能,例如数据清洗、数据筛选、数据排序、数据透视表、图表制作等。用户可以通过简单的操作,轻松获取并处理大量的数据,从而更好地理解数据,发现数据中隐藏的规律和关联。 与传统的Excel相比,Datawhale Excel在界面设计和功能功能方面进行了优化和改进。它拥有直观的操作界面和人性化的功能布局,使得用户能够更快速地上手并掌握工具的使用。同时,Datawhale Excel还提供了丰富的学习资源和实战案例,帮助用户深入学习和应用数据分析知识。 Datawhale Excel的优势不仅在于其强大的数据处理和分析功能,还在于它的开放性和可扩展性。用户可以自定义宏和公式,根据自己的需求进行二次开发和应用。这使得Datawhale Excel成为了一款灵活多变的工具,适用于不同领域的数据分析需求。 总而言之,Datawhale Excel是一款功能强大、易于使用的数据分析工具。它帮助用户高效地处理和分析数据,发现数据中隐藏的规律和趋势,为用户在工作和学习中带来便利和效益。无论是在商业、教育还是科研领域,Datawhale Excel都是一款理想的助手。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值