Decision Tree决策树练习题

最新推荐文章于 2025-03-14 15:44:56 发布

北风扬尘尘飞扬

最新推荐文章于 2025-03-14 15:44:56 发布

阅读量5.2k

点赞数 2

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45458665/article/details/102699402

版权

以下习题来自：机器学习实战：基于Scikit-Learn和Tensorflow一书。

如果训练集有100万个实例，训练决策树（无约束）大致的深度是多少？
答：一个包含m个叶节点的均衡二叉树的深度等于log₂（m）的四舍五入。通常来说，二元决策树训练到最后大体都是平衡的，如果不加以限制，最后平均每个叶节点一个实例。因此，如果训练集包含一百万个实例，那么决策树深度约等于log2（106）≈20层（实际上会更多一些，因为决策树通常不可能完美平衡）。
通常来说，子节点的基尼不纯度是高于还是低于其父节点？是通常更高/更低？还是永远更高/更低？
答：一个节点的基尼不纯度通常比其父节点低。这是通过CART训练算法的成本函数确保的。该算法分裂每个节点的方法，就是使其子节点的基尼不纯度的加权之和最小。但是，如果一个子节点的不纯度远小于另一个，那么也有可能使子节点的基尼不纯度比其父节点高，只要那个不纯度更低的子节点能够抵偿这个增加即可。。举例来说，假设一个节点包含4个A类别的实例和1个B类别的实例，其基尼不纯度等于0.32。现在我们假设数据集是一维的，并且实例的排列顺序如下：A，B，A，A，A。你可以验证，算法将在第二个实例后拆分该节点，从而生成两个子节点所包含的实例分别为A，B和 A，A，A。第一个子节点的基尼不纯度为 0.5，比其父节点要高。这是因为第二个子节点是纯的&

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。