机器学习之决策树：二、算法案例

最新推荐文章于 2023-07-31 20:56:06 发布

梅菜扣肉鱼丸粗面

最新推荐文章于 2023-07-31 20:56:06 发布

阅读量424

点赞数

分类专栏：机器学习文章标签：决策树可视化机器学习 python

本文链接：https://blog.csdn.net/qushuo123/article/details/107192666

版权

本文通过鸢尾花数据集介绍了如何使用决策树进行分类，并详细讲述了如何利用Graphviz进行决策树模型的可视化，包括Anaconda3中安装Graphviz的步骤和画图代码示例。

摘要由CSDN通过智能技术生成

一、鸢尾花数据集决策树分类

from sklearn.datasets import load_iris
from sklearn import tree  
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.metrics import classification_report,confusion_matrix
from sklearn.feature_extraction import DictVectorizer
import random

# 导入数据集
iris = load_iris()
# 特征
iris_feature = iris.data
# 分类标签
iris_label = iris.target

# 数据集划分
#x_train,x_test,y_train,y_test = train_test_split(iris_feature,iris_label,test_size=0.4)

#随机打乱数据
data_size = iris.data.shape[0]
index = [i for i in range(data_size)] 
random.shuffle(index)  
iris.data = iris.data[index]
iris.target = iris.target[index]

#切分数据集
test_size = 40#总共150个数据，三种各50
x_train = iris.data[test_size:]
x_test =  iris.data[:test_size]
y_train = iris.target[test_size:]
y_test = iris.target[:test_size]


model = tree.DecisionTreeClassifier()
# 模型训练
model.fi