机器学习算法的Python实现 (3)：决策树剪枝处理

最新推荐文章于 2024-04-30 16:06:32 发布

Will-Lin

最新推荐文章于 2024-04-30 16:06:32 发布

阅读量2.9w

点赞数 18

分类专栏：机器学习 python 文章标签：机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wzmsltw/article/details/51057311

版权

更新，经评论提醒，我发现自己搞错了比较根本的定义。CART决策树假设决策树是二叉树，这里给出的代码生成的决策树不是二叉树。所以下面的代码用”基于基尼指数生成的决策树“来形容更加适当一点。

-------------------------------------------

本文数据参照机器学习-周志华一书中的决策树一章。可作为此章课后习题4的答案

代码则参照《机器学习实战》一书的内容，并做了一些修改。

CART决策树使用基尼指数（Gini Index）来选择划分属性。其公式如下：

本文内容包括未剪枝CART决策树、预剪枝CART决策树以及后剪枝决策树

本文使用的Python库包括

numpy
pandas
math
operator
matplotlib
copy
re

本文使用的数据如下

Idx	color	root	knocks	texture	navel	touch	label
1	dark_green	curl_up	little_heavily	distinct	sinking	hard_smooth	1
2	black	curl_up	heavily	distinct	sinking	hard_smooth	1
3	black	curl_up	little_heavily	distinct	sinking	hard_smooth	1
6	dark_green	little_curl_up	little_heavily	distinct	little_sinking	soft_stick	1
7	black	little_curl_up	little_heavily	little_blur	little_sinking	soft_stick	1
10	dark_green	stiff	clear	distinct	even	soft_stick	0
14	light_white	little_curl_up	heavily	little_blur	sinking	hard_smooth	0
15	black	little_curl_up	little_heavily	distinct	little_sinking	soft_stick	0
16	light_white

最低0.47元/天解锁文章

关注

18
点赞
踩
145

收藏

觉得还不错? 一键收藏
17
评论
机器学习算法的Python实现 (3)：决策树剪枝处理

本文数据参照机器学习-周志华一书中的决策树一章。可作为此章课后习题4的答案代码则参照《机器学习实战》一书的内容，并做了一些修改。CART决策树使用基尼指数（Gini Index）来选择划分属性。其公式如下：本文内容包括未剪枝CART决策树、预剪枝CART决策树以及后剪枝决策树本文使用的Python库包括numpypandasmath
复制链接

扫一扫

专栏目录

评论 17

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。