集成学习task1

1、集成学习的概念
结合多个个体学习器完成任务
2、个体学习器的概念
具有特定算法可构成集成学习的学习器
3、boosting bagging的概念、异同点
https://www.cnblogs.com/liuwu265/p/4690486.html

4、理解不同的结合策略(平均法,投票法,学习法)
平均法:所有学习器预测结果的平均值作为最终预测结果
投票法:所有学习器预测结果的众数最为最终预测结果
学习法:利用所有学习器的预测结果训练模型得到最终预测结果

5、随机森林的思想
Bagging + 决策树 = 随机森林

6、随机森林的推广
https://www.cnblogs.com/pinard/p/6156009.html
7、随机森林的优缺点
优点
可以处理高维数据,不同进行特征选择(特征子集是随机选择)
模型的泛化能力较强
训练模型时速度快,成并行化方式,即树之间相互独立
模型可以处理不平衡数据,平衡误差
最终训练结果,可以对特种额排序,选择比较重要的特征
随机森林有袋外数据(OOB),因此不需要单独划分交叉验证集
对缺失值、异常值不敏感
模型训练结果准确度高
缺点
当数据噪声比较大时,会产生过拟合现象对有不同取值的属性的数据,取值划分较多的属性会对随机森林产生更大的影响

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值