Python机器学习实战之决策树分类

最新推荐文章于 2024-07-11 09:58:56 发布

Timmy_Y

最新推荐文章于 2024-07-11 09:58:56 发布

阅读量1.1k

点赞数

分类专栏：算法学习机器学习 Python 机器学习笔记文章标签：机器学习决策树 python 实战

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mingtian715/article/details/53924886

版权

本文介绍了Python中机器学习的决策树分类方法，详细阐述了决策树算法的工作原理、优点和缺点，如低计算复杂度和易于理解。并解释了构建决策树的过程，包括递归划分节点和确定最佳划分属性的步骤。内容参照了《机器学习实战》一书。

摘要由CSDN通过智能技术生成

决策树

决策树是一种常用的机器学习方法，它基于树的结构，依次根据不同属性值来进行数据分类，具体算法原理及细节可以参考之前写的决策树和MATLAB函数使用

决策树的优点：采用递归进行数据训练、数据分类，因此计算复杂度不高，可以清晰理解哪些属性重要。

决策树的缺点：不太适用于连续值的划分（划分节点过多可能造成过拟合），即类别太多时，泛化误差高，一般需要剪枝处理。

决策树分类

构建一颗决策树主其实是一个递归的过程，每一层主要需要以下两步：

（1）确定当前节点有无继续划分的需要，不需要划分，则确定当前节点所属类别（或标签）

（2）如果需要划分确定最佳划分属性，继续生成子树

参考《机器学习实战》代码，每一个函数的作用都写了注释

from math import log
import operator


#训练数据，用于创建决策树
def  createDataSet():
    dataSet = [[1,1,'yes']

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Timmy_Y CSDN认证博客专家 CSDN认证企业博客

码龄13年

56: 原创

4万+: 周排名

40万+: 总排名

107万+: 访问

: 等级

5806: 积分

424: 粉丝

501: 获赞

181: 评论

2609: 收藏

私信

关注

热门文章

分类专栏

最新评论

有关Pca的使用：样本数目和降维数目的关系
scarlett928: 谢谢博主，解决了我一直以来困惑的问题！
有关Pca的使用：样本数目和降维数目的关系
qq_42711025: 那么有什么降维方法可以满足降维后特征数大于样本数，小于原始特征数呢？
MATLAB中GUI的使用技巧（1）之axes
侠客行-正心诚意: 我也是这个，类 Axes 的属性 imshow(f) 无法识别。% f = imread('D:\机器视觉代码\matlab\测试2.jpeg'); % subplot 221 imshow(f); % subplot 222 imhist(f); % ylim('auto'); % q = histeq(f,256); % subplot 223 imshow(q); % subplot 224 imhist(q); % ylim('auto') %类 Axes 的属性 imshow(f) 无法识别???
Scikit-learn实例之Pca+Svm人脸识别(AT&T数据集)
大栗子呀: 因为后面博主修改成了10个特征向量，所以画图的地方将n_col设置小一点等于3就可以了，这样只有9张图，小于10
Scikit-learn实例之Pca+Svm人脸识别(AT&T数据集)
大栗子呀: 我把测试集占的比例改成0.5就有40类了，之前应该是测试集太小了导致有一类不在测试集

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。