基于机器学习的心脏病预测方法（8）——决策树（Decision Tree）

wendy_ya

已于 2023-02-15 12:36:42 修改

阅读量2.7k

点赞数

分类专栏：基于机器学习的心脏病预测方法 python 文章标签：决策树 sklearn python

于 2021-09-11 19:58:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/didi_ya/article/details/120241966

版权

基于机器学习的心脏病预测方法同时被 2 个专栏收录

14 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

103 篇文章

订阅专栏

本文详细介绍了决策树在心脏病预测中的应用，包括决策树的基本概念、核心代码实现、可视化展示以及评价指标。通过实验，决策树在训练集上达到100%准确率，但在测试集上存在过拟合问题，通过限制最大深度得到改善。最后，与其他四种算法的准确率进行了比较，随机森林表现最佳。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

一、决策树介绍

决策树（Decision Tree）是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法，是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干，故称决策树。在机器学习中，决策树是一个预测模型，他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度，使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。
决策树是一种树形结构，其中每个内部节点表示一个属性上的测试，每个分支代表一个测试输出，每个叶节点代表一种类别。
决策树是一种十分常用的分类方法。它是一种监督学习。

伪代码实现：

将数据集的最佳属性放在树根上。
将训练集拆分为子集。子集的创建方式应确保每个子集包含具有相同属性值的数据。
对每个子集重复步骤1和步骤2，直到树的所有分支中找到叶节点。

创建决策树时的假设：

开始时，整个训练集被视为根。
特征值最好是离散的。如果值是连续的，则在构建模型之前对其进行离散化。
记录是基于属性值递归分布的。
将属性作为树的根或内部节点的顺序是

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wendy_ya 您的鼓励将是我创作的最大动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。