机器学习（9）决策树（决策树分类鸢尾花）

最新推荐文章于 2024-08-19 09:07:43 发布

_(*^▽^*)_

最新推荐文章于 2024-08-19 09:07:43 发布

阅读量1.8k

点赞数 3

分类专栏： # 机器学习文章标签：决策树算法机器学习人工智能 sklearn

本文链接：https://blog.csdn.net/great_yzl/article/details/120227219

版权

机器学习专栏收录该内容

22 篇文章 17 订阅

订阅专栏

一、基础理论

决策树思想：

程序设计中的条件分支结构是if-else分支结构，最早的决策树就是利用这类结构分割数据。

目的：找到最高效的决策顺序。

二、决策树分类鸢尾花

API

sklearn.tree.DecisionTreeClassifier

1、读取数据

# 1、获取数据集
iris = load_iris()

2、划分数据集

# 2、划分数据集
train_data, test_data, train_target, test_target = train_test_split(iris.data, iris.target)

3、创建决策树预估器，训练

# 3、决策树预估器，训练
estimator = DecisionTreeClassifier()
estimator.fit(train_data, train_target)

4、模型评估

方法一：比对法

# 方法一：比对法
predict = estimator.predict(test_data)
print(predict == test_target)

方法二：计算错误率

# 方法二：计算错误率
score = estimator.score(test_data, test_target)
print('分类错误率：', score)

代码

# 决策树分类鸢尾花
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.tree import export_graphviz

# 1、获取数据集
iris = load_iris()

# 2、划分数据集
train_data, test_data, train_target, test_target = train_test_split(iris.data, iris.target)

# 3、决策树预估器，训练
estimator = DecisionTreeClassifier()
estimator.fit(train_data, train_target)

# 4、模型评估
# 方法一：比对法
predict = estimator.predict(test_data)
print(predict == test_target)

# 方法二：计算错误率
score = estimator.score(test_data, test_target)
print('分类正确率：', score)