iris数据_实现ID3算法用于鸢尾花(Iris)数据分类及实现confusion matrix 评价分类结果...

该博客详细介绍了如何使用Python实现ID3决策树算法,并在鸢尾花数据集上进行应用。内容包括训练数据划分、分类器性能评价,以及对决策树中连续值处理的探讨。虽然未涉及剪枝,但提供了相关资源链接供读者了解决策树剪枝。同时,还讨论了混淆矩阵及其在评估分类器性能中的应用,特别是针对二分类和多分类问题的区别。
摘要由CSDN通过智能技术生成

从训练数据划分,到分类器性能评价均没有使用scikit-learn中的方法

代码

具体代码:https://github.com/kai123wen/MachineLearningAlgClass/tree/master/ID3

鸢尾花数据下载地址:https://archive.ics.uci.edu/ml/datasets/Iris

代码中有着详细的注释,直接看就好

tree.py

import 

值得注意的问题

下面我放了几个网址,因为这些网址写的都很好了,没必要再复制一遍。看明白了这些网址,也就明白了对应的问题

ID3算法介绍:

参考:https://zhuanlan.zhihu.com/p/26760551

决策树中连续值的处理:

参考:

  1. https://blog.csdn.net/Leafage_M/article/details/80137305
  2. https://blog.csdn.net/u012328159/article/details/79396893

决策树中剪枝处理

由于处理鸢尾花数据没有必要进行剪枝,因此代码中没有这一部分内容,但是决策树的剪枝还是要知道的

参考:https://www.jianshu.com/p/794d08199e5e

confusion matrix 构建

关于confusion matrix

confusion matrix 在机器学习中常用来评价监督学习算法的性能

参考:https://www.geeksforgeeks.org/confusion-matrix-machine-learning/

通过 confusion matrix 计算 precision 、recall

注意confusion matrix用于分类问题时,有的分类问题是二分类的(如判断一种动物是否属于鱼),有的问题是多分类的(如鸢尾花的判断),两种问题虽然本质是一样的,但是在实现confusion matrix时还是有些不同

参考:https://www.python-course.eu/confusion_matrix.php

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值