数据分析项目设计与实现

集成学习

a8e8845d692740feadf2eb28468d3e92.png376867ca938c46f9a1c9f1d568d4b200.png7dcce562f12f4e5a96c6adb87a0f66bd.png 

集成学习方法结合了多个模型的分类结果,其性能往往比单个模型的性能要更好。

集成学习的方法:
(1)Boosting(Adaboost / Gbdt) : 第一轮随机从训练集中抽取一部分数据,对model1进行训练,然后使用 model1对整个训练集进行训练。第二轮,分类错误的数据,更容易进入到抽取的数据中,再利用这些数据对 model2进行训练。然后使用model2,对整个训练集进行训练。如此重复m次,使用了m个模型。Boosting模型可以 很好地对分类错误的数据,进行学习。
(2)Bagging (Random Forest) :每次随机从训练集中,有放回地随机抽取一部分数据,重复k次,得 到k份数据。然后使用k个模型,对这些数据进行单独学习。

决策树(decision tree)

5b24676db35d49c99087440a8da59ca2.png

d1e51055d29c4e8ca4a8e3487bea5937.png 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值