scikit-learn决策树算法（鸢尾花数据集、餐饮饭店销量）

最新推荐文章于 2023-11-08 19:05:48 发布

VIP文章 Happy_change

最新推荐文章于 2023-11-08 19:05:48 发布

阅读量1.7k

点赞数 4

分类专栏：课程学习记录

本文链接：https://blog.csdn.net/Happy_change/article/details/110437093

版权

文章目录

实验三、scikit-learn决策树算法

实验三、scikit-learn决策树算法

一、实验目的

1. 熟悉掌握决策树的原理

2. 使用scikit-learn库中的对应函数实现决策树分类。

二、能力图谱

三、实验工具

1. Anaconda

2. sklearn

四、实验内容

scikit-learn决策树算法类库内部实现是使用了调优过的CART树算法，既可以做分类，又可以做回归。分类决策树的类对应的是DecisionTreeClassifier。

1.对鸢尾花数据集建立决策树

(1) 鸢尾花数据集
在Sklearn机器学习包中，集成了各种各样的数据集，包括前面的糖尿病数据集，这里引入的是鸢尾花卉（Iris）数据集，它是很常用的一个数据集。鸢尾花有三个亚属，分别是山鸢尾（Iris-setosa）、变色鸢尾（Iris-versicolor）和维吉尼亚鸢尾（Iris-virginica）。

该数据集一共包含4个特征变量，1个类别变量。共有150个样本，iris是鸢尾植物，这里存储了其萼片和花瓣的长宽，共4个属性，鸢尾植物分三类。如表17.2所示：

iris里有两个属性iris.data，iris.target。data是一个矩阵，每一列代表了萼片或花瓣的长宽，一共4列，每一行代表某个被测量的鸢尾植物，一共采样了150条记录。

from sklearn.datasets import load_iris   #导入数据集iris
iris = load_iris()  #载入数据集
print iris.data
#[n_samples,n_features]
iris.target

(2) 决策树分类
（1）导入模块
（2）载入iris数据集
（3）提取特征
（4）输出结果

#导入模块
import numpy as np
%matplotlib auto
import matplotlib.pyplot as plt
from sklearn import

最低0.47元/天解锁文章

Happy_change

关注

4
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
scikit-learn决策树算法（鸢尾花数据集、餐饮饭店销量）

文章目录实验三、scikit-learn决策树算法一、实验目的1. 熟悉掌握决策树的原理2. 使用scikit-learn库中的对应函数实现决策树分类。二、能力图谱三、实验工具1. Anaconda2. sklearn四、实验内容1.对鸢尾花数据集建立决策树2.ID3算法实现对餐饮饭店销量的高低分类五、实验总结（写出本次实验的收获，遇到的问题等）遇到的问题收获实验三、scikit-learn决策树算法一、实验目的1. 熟悉掌握决策树的原理2. 使用scikit-learn库中的对应函数实现决策树分类
复制链接

扫一扫