八、Sklearn决策树与随机森林

本文深入探讨了随机森林的基石——决策树,包括如何创建决策树,以及决策树面临的过拟合问题。接着介绍了随机森林作为评估器集成算法的优势,如降低过拟合、并行计算和概率分类。文中还展示了随机森林在回归任务中的应用,并总结了随机森林在机器学习中的优点和解释性挑战。
摘要由CSDN通过智能技术生成

参考url:

https://jakevdp.github.io/PythonDataScienceHandbook/05.08-random-forests.html

无参数算法随机森林,是一种集成方法,通过集成多个比较简单的评估器形成累计效果,即若干评估器的多数投票(majority vote)的最终效果往往优于单个评估器投票的效果。

1、随机森林的诱因:决策树  

  随机森林是建立在决策树基础上的集成学习器。

  决策树采用非常直观的方式对事物进行分类或打标签:只需问一系列问题就可以进行分类了。

  二叉树分支方法可以非常有效地进行分类:在一颗结构合理的决策树中,每个问题基本上都可将种类可能性减半,即使是对大量种类进行决策时,也可以很快地缩小选择范围。

  决策树的难点在于如何设计每一步的问题,在实现决策树的机器学习算法中,问题通常因分类边界是与特征轴平行的形式分割数据而造成的,即决策树的每个节点都根据一个特征的阈值将数据分成两组。

  1、创建一颗决策树

    

    在这组数据上构建的简单决策树不断将数据的一个特征或另一个特征按照某种判定条件进行分割。

    每分割一次,都将新区域内点的多数投票结果标签分配到该区域上。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值