[机器学习算法]决策树CART和随机森林模型

本文详细介绍了决策树CART,包括分类决策树的GINI系数、回归决策树的最小方差选择,以及决策树的优点和剪枝算法。接着阐述了随机森林的生成过程和特点,强调其准确率高、不易过拟合和处理变量的灵活性。
摘要由CSDN通过智能技术生成

目录

一、决策树CART

1.1分类决策树

1.2回归决策树

1.3 决策树优点与缺点

1.4 决策树剪枝算法

二、随机森林RF

2.1随机森林的生成

2.2 随机森林的特点


、决策树CART

        CART分类回归树是一种典型的二叉决策树,可以处理分类或者回归问题。如果待预测结果是离散型数据,则CART生成分类决策树;如果待预测结果是连续型数据,则CART生成回归决策树。

1.1分类决策树

       选择GINI系数作为分裂节点的依据。

       对于给定的样本集合D,其基尼指数为

      Gini系数表示该数据集中样本属于某一类的不确定程度,Gini系数越小,样本类别的不确定性越小。如样本集合D中只有一个类别,gini系数为0,样本类别不确定性为0。

       对含有N个样本的样本集S,根据属性A的第i个属性值,将样本集分为S1和S2,Gini系数为:

       对于属性A,计算所有属性值将数据集分为两部分后的Gini系数,选取其中的最小值,作为属性A得到的最优二分方案:

        对于数据集中的所有属性,计算最优二分方案,选取最小值,作为样本S的最优二分方案:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值