第六章习题

最新推荐文章于 2022-10-28 10:16:11 发布

随.变.

最新推荐文章于 2022-10-28 10:16:11 发布

阅读量473

点赞数

分类专栏：机器学习文章标签：决策树机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_50765975/article/details/126662840

版权

机器学习专栏收录该内容

17 篇文章 3 订阅

订阅专栏

1.如果训练集有100万个实例，训练决策树（无约束）大致的深度是多少？

一个包含m个叶节点的均衡二叉树的深度等于log2（m）（注： log2是基2对数，log2（m）=log（m）/log（2）。），取整。通常来说，二元决策树（只做二元决策的树，就像Scikit-Learn中的所有树一样）训练到最后大体都是平衡的，如果不加以限制，最后平均每个叶节点一个实例。因此，如果训练集包含100万个实例，那么决策树的深度为log2（106）≈20层（实际上会更多一些，因为决策树通常不可能完美平衡）。

2.通常来说，子节点的基尼不纯度是高于还是低于其父节点？是通常更高/更低？还是永远更高/更低？

一个节点的基尼不纯度通常比其父节点低。这是由于CART训练算法的成本函数。该算法分裂每个节点的方法，就是使其子节点的基尼不纯度的加权之和最小。但是，如果一个子节点的不纯度远小于另一个，那么也有可能使子节点的基尼不纯度比其父节点高，只要那个不纯度更低的子节点能够抵偿这个增加即可。

3.如果决策树过拟合训练集，减少max_depth是否为一个好主意？

如果决策树过拟合训练集，降低max_depth可能是一个好主意，因为这会限制模型，使其正则化。

4.如果决策树对训练集欠拟合，尝试缩放输入特征是否为一个好主意？

决策树的优点之一就是它们不关心训练数据是缩放还是集中，所以如果决策树不适合训练集，缩放输入特征不过是浪费时间罢了。

5.如果在包含100万个实例的训练集上训练决策树需要一个小时，那么在包含1000万个实例的训练集上训练决策树，大概需要多长时间？

决策树的训练复杂度为O（n×mlog（m））。所以，如果将训练集大小乘以10，训练时间将乘以K=（n×10m×log（10m））/ （n×m×log（m））=10×log（10m）/log（m）。如果m=106，那么 K≈11.7，所以训练1000万个实例大约需要11.7小时。

6.如果训练集包含10万个实例，设置presort=True可以加快训练吗？

只有当数据集小于数千个实例时，预处理训练集才可以加速训练。如果包含100 000个实例，设置presort=True会显著减慢训练。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

随.变. CSDN认证博客专家 CSDN认证企业博客

码龄4年

17: 原创

133万+: 周排名

165万+: 总排名

7914: 访问

: 等级

190: 积分

12: 粉丝

12: 获赞

4: 评论

24: 收藏

私信

关注

热门文章

分类专栏

机器学习 17篇

最新评论

《机器学习实战》第二章
hrb500: 为啥代码全部复制上去运行，就报错啊FileNotFoundError: [Errno 2] No such file or directory: 'datasets\\housing\\housing.csv'
《机器学习实战》第二章练习题
m0_69395248: 我每一个CV都要跑你两倍的时间，真的是硬件的问题吗。我的处理器也是i7的啊
《机器学习实战》第二章练习题
sakeww: 很棒的题解，向大佬学习！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。