零基础入门数据挖掘 Task05:模型结果融合

本文介绍了数据挖掘中模型融合的三种方法:简单加权融合、stacking和boosting/bagging。重点讨论了stacking的概念、工作原理以及如何通过次级学习器结合初级学习器的预测结果。同时提到了防止过拟合的策略,如使用简单线性模型和K折交叉验证。
摘要由CSDN通过智能技术生成

Task05:模型结果融合

赛题:零基础入门数据挖掘 - 二手车交易价格预测
地址:https://tianchi.aliyun.com/competition/entrance/231784/information

1 内容介绍

1.1 简单加权融合

  • 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);
  • 分类:投票(Voting)
  • 综合:排序融合(Rank averaging),log融合

1.2 stacking/blending

  • 构建多层模型,并利用预测结果再拟合预测。

1.3 boosting/bagging(在xgboost,Adaboost,GBDT中已经用到

  • 多树的提升方法

2 Stacking相关理论介绍

可参考模型融合—— stacking详细讲解

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值