随机森林 经济学

本文探讨了随机森林在经济学中的应用,重点介绍了节点不纯度函数,如基尼指数和信息熵在选择分裂变量中的作用。同时,阐述了剪枝的重要性,特别是成本复杂性修枝方法,以防止过拟合。随机森林作为集成学习的一种,通过创建多个决策树并结合其结果,能够在高维空间中提供更准确的预测,同时减少噪声变量的影响。
摘要由CSDN通过智能技术生成

KNN高维空间很难找邻居(curse of dimensionality)

分类树的预测非常简单,just drop an observation down the tree(回答一系列的是或否问题),使用多数票规则(majority vote rule)

CART算法使用“二叉树”(binary tree),本质上将“特征空间”(feature space)进行递归分割(recursive partitioning),每次总是沿着与某个变量x轴平行的方向进行切割,切成矩形区域。

节点不纯度函数(Node Impurity Functions)

分类树

选择什么变量(split variable)进行分裂?

目标:使得分裂之后的两个子节点内部的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值