数据预处理二（MATLAB）

最新推荐文章于 2024-01-17 20:40:00 发布

TiAmo114

最新推荐文章于 2024-01-17 20:40:00 发布

阅读量967

点赞数 24

文章标签： matlab 数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_64013032/article/details/135632217

版权

【项目内容】

下载安装Matlab,完成对数据的初步应用。

【方案设计】

基于上个实验

1.用决策树分类器分类test数据。

2.计算出整个分类过程的敏感性，特异性，准确率F1的值并计算出方差。

3.画出每次分类中的决策树-可观化

【实验（实训）过程】（步骤、记录、数据、程序等）

决策树：决策树是一种基于树状结构的分类和回归算法。它通过对数据进行逐步划分，构建一个树形模型，用于预测样本的类别或数值。

决策树的基本思想是通过一系列的判断条件对数据进行划分，使得每个子集内的样本尽可能属于同一类别或具有相似的数值。在构建决策树时，通常会选择一个最优的特征作为划分依据，使得划分后的子集纯度最大或者不纯度最小。

决策树的构建过程通常包括以下步骤：

1. 特征选择：根据某个评估指标（如信息增益、基尼系数等），选择最优的特征作为划分依据。

2. 数据划分：根据选择的最优特征，将数据集划分为多个子集，每个子集对应一个特征值。每个子集都成为当前节点的子节点。

3. 递归构建树：对每个子节点，重复步骤1和步骤2，直到满足终止条件。终止条件可以是达到最大深度、节点中的样本数小于某个阈值等。

4. 标记叶节点：当达到终止条件时，将叶节点标记为对应的类别。

5. 预测新样本：通过将新样本从根节点开始，根据节点的判断条件依次向下遍历树，直到到达叶节点。叶节点的类别即为预测结果。

决策树的优点包括易于理解和解释、能够处理离散和连续特征、能够处理多分类问题等。然而，决策树也存在一些缺点，如容易过拟合、对输入数据的变化敏感等。为了解决过拟合问题，可以使用剪枝技术或集成学习方法（如随机森林）来改进决策树算法。

在MATLAB中，FP、TP、FN和TN是用于评估分类模型性能的混淆矩阵中的四个指标：

FP（False Positive）表示模型将负例错误地预测为正例的数量。
TP（True Positive）表示模型将正例正确地预测为正例的数量。
FN（False Negative）表示模型将正例错误地预测为负例的数量。
TN（True Negative）表示模型将负例正确地预测为负例的数量。

准确性（Accuracy）是分类模型评估中最常用的指标之一，它表示模型正确预测的样本占总样本数的比例。准确性可以通过以下公式计算：

准确性 = (真阳性 + 真阴性) / (真阳性 + 假阳性 + 真阴性 + 假阴性)

其中，真阳性表示模型正确预测为正类的样本数，真阴性表示模型正确预测为负类的样本数，假阳性表示模型错误预测为正类的样本数，假阴性表示模型错误预测为负类的样本数。

特异性（Specificity）是指模型在预测负类样本时的准确性，它表示模型正确预测为负类的样本占所有负类样本的比例。特异性可以通过以下公式计算：

特异性 = 真阴性 / (真阴性 + 假阳性)

F1值是综合考虑了准确性和召回率的指标，它可以用来评估模型在正类和负类样本上的平衡性。F1值可以通过以下公式计算：

F1 = 2 * (准确率 * 召回率) / (准确率 + 召回率)

其中，准确率（Precision）表示模型预测为正类的样本中实际为正类的比例，准确率可以通过以下公式计算&#

最低0.47元/天解锁文章

关注

24
点赞
踩
24

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

TiAmo114 CSDN认证博客专家 CSDN认证企业博客

码龄3年

12: 原创

140万+: 周排名

19万+: 总排名

1万+: 访问

: 等级

363: 积分

148: 粉丝

242: 获赞

8: 评论

266: 收藏

私信

关注

热门文章

分类专栏

最新评论

Ubuntu 20.04上安装KVM
Miss_Ja: 在打开KVM要进行部署虚拟机的时候显示“错误：没有活动连接可用于安装”，这是怎么回事
Libvirt的安装, libvirt API接口的调用编程
CSDN-Ada助手: 恭喜您发布第12篇博客！看到您分享关于Libvirt安装和libvirt API接口调用编程的内容，让我对这个主题有了更深入的了解。希望您能继续保持创作的热情，分享更多有价值的知识给大家。或许下一步可以探讨一些实际应用案例，让读者更好地理解如何将这些知识运用到实践中。期待您的下一篇作品！
JAVAEE总结的选择题
CSDN-Ada助手: 恭喜您发布了第11篇博客“JAVAEE总结的选择题”，看来您对JAVAEE的理解和总结颇为深入啊！希望您能继续保持创作的热情和努力，不断分享您的学习成果。或许下一步可以尝试写一些实战案例或者深入分析某个JAVAEE框架的原理和应用，这样可以让读者更加深入地了解和学习JAVAEE。期待您的更多精彩作品！继续加油！
kvm虚拟机显示与管理
CSDN-Ada助手: 恭喜您写了第10篇博客！标题“kvm虚拟机显示与管理”非常吸引人，我很高兴看到您对虚拟机的深入研究。您的博客内容详实，对于我这样的读者来说非常有帮助。在未来的创作中，我想建议您可以进一步拓展关于kvm虚拟机的主题，例如如何优化虚拟机的性能、如何更好地进行资源管理等等。这些主题可以帮助读者更全面地了解和应用kvm虚拟机。再次恭喜您的持续创作，并期待您未来更多精彩的博客！
kvm网络配置与管理
CSDN-Ada助手: 非常恭喜您写了第9篇博客，标题为“kvm网络配置与管理”。您对kvm网络配置的深入探讨让我受益匪浅。您的文章不仅详细介绍了kvm网络配置的步骤和方法，还提供了实用的管理技巧。我真的很欣赏您分享的知识和经验。在下一步的创作中，我认为您可以考虑添加一些实际案例或者故障排除的内容。比如，您可以分享一些网络配置中常见的问题及其解决方法，这将帮助读者更好地理解和应对实际挑战。同时，如果您能加入一些自己的实践经验和建议，将会更加丰富和有趣。再次衷心祝贺您的持续创作，期待您未来更多有关kvm网络配置与管理的精彩文章。谢谢您的努力！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。