sklearn数据集——iris鸢尾花数据集_iris数据集(1)

2401_84010362

于 2024-04-21 19:26:35 发布

阅读量915

点赞数 17

分类专栏：程序员文章标签： sklearn 人工智能算法

本文链接：https://blog.csdn.net/2401_84010362/article/details/138042622

版权

1、初始数据

鸢尾花（Iris）数据集，是机器学习和统计学中一个经典的数据集。它包含在 scikit-learn 的 datasets 模块中。

我们可以调用 load_iris 函数来加载数据：

from sklearn.datasets import load_iris
iris_dataset = load_iris()

load_iris 返回的 iris 对象是一个 Bunch 对象，与字典非常相似，里面包含键和值：

# 查看数据集的keys
print('Keys of iris_dataset: \n{}'.format(iris_dataset.keys()))

输出：

Keys of iris_dataset: 
dict_keys(['data', 'target', 'frame', 'target_names', 'DESCR', 'feature_names', 'filename', 'data_module'])

可以看到，数据集有很多的keys。

DESCR 键对应的值是数据集的简要说明。我们查看前面的部分内容：

print(iris_dataset['DESCR'][:193] + "\n...")

输出：

.. _iris_dataset:

Iris plants dataset
--------------------

**Data Set Characteristics:**

    :Number of Instances: 150 (50 in each of three classes)
    :Number of Attributes: 4 numeric, pre
...

通过上面的描述信息，我们可以知道该数据集包含150条数据，每50条数据属于一个类别，即有三个类别，每一条数据有四个特征。

target_names 键对应的值是一个字符串数组，里面包含我们要预测的花的品种：

print("Target names: {}".format(iris_dataset['target_na

最低0.47元/天解锁文章

2401_84010362

关注

17
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
sklearn数据集——iris鸢尾花数据集_iris数据集(1)

鸢尾花（Iris）数据集，是机器学习和统计学中一个经典的数据集。它包含在 scikit-learn 的 datasets 模块中。我们可以调用 load_iris 函数来加载数据：load_iris 返回的 iris 对象是一个 Bunch 对象，与字典非常相似，里面包含键和值：输出：可以看到，数据集有很多的keys。DESCR 键对应的值是数据集的简要说明。我们查看前面的部分内容：输出：通过上面的描述信息，我们可以知道该数据集包含150条数据，每50条数据属于一个类别，即有三个类别，每一条数据有
复制链接

扫一扫