利用随机森林做特征选择

随机森林是流行的机器学习算法,提供了mean decrease impurity和mean decrease accuracy两种特征选择方法。平均不纯度减少考虑特征如何减少决策树的不纯度,可能偏向于类别多的变量。平均精确率减少通过衡量特征值顺序改变对模型精确率的影响来评估特征重要性。尽管重要特征的删除可能不会显著降低模型性能,因为相关特征可以补偿。
摘要由CSDN通过智能技术生成

        随机森林具有准确率高、鲁棒性好、易于使用等优点,这使得它成为了目前最流行的机器学习算法之一。随机森林提供了两种特征选择的方法:mean decrease impuritymean decrease accuracy


平均不纯度减少----mean decrease impurity

        随机森林由多个决策树构成。决策树中的每一个节点都是关于某个特征的条件,为的是将数据集按照不同的响应变量一分为二。利用不纯度可以确定节点(最优条件),对于分类问题,通常采用基尼不纯度

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值