鸢尾指的是鸢尾属植物。本数据集共包含三种鸢尾属花卉的特征及类别数据。
三种花卉 (Iris-Virginica、Iris-Versicolor、Iris-Setosa) 的形态如下所示:
数据集内容
数据集内容,包括如下所示的若干子数据。
>> from sklearn import datasets
>> iris = datasets.load_iris()
>> list(iris.keys())
['data',
'target',
'frame',
'target_names',
'DESCR',
'feature_names',
'filename']
数据集特征名称
样本特征包括如下所示维度:sepal length 花萼长度、sepal width 花萼宽度、petal length 花瓣长度、petal width 花瓣宽度
>> iris['feature_names']
['sepal length (cm)',
'sepal width (cm)',
'petal length (cm)',
'petal width (cm)']
数据集特征值
如下所示二维数组的每一行,代表一个样本的特征值,这些特征值对应于 sepal length 花萼长度、sepal width 花萼宽度、petal length 花瓣长度、petal width 花瓣宽度
>>> iris['data']
array([[5.1, 3.5, 1.4, 0.2],
[4.9, 3. , 1.4, 0.2],
[4.7, 3.2, 1.3, 0.2],
[4.6, 3.1, 1.5, 0.2],
...
[6.3, 2.5, 5. , 1.9],
[6.5, 3. , 5.2, 2. ],
[6.2, 3.4, 5.4, 2.3],
[5.9, 3. , 5.1, 1.8]])
数据集类别名称
数据集中的样本实例隶属于如下所示的三种植物名称:、、
>> iris['target_names']
array(['setosa', 'versicolor', 'virginica'], dtype='<U10')
数据集类别值
如下所示的每一个数组元素,代表了一个样本实例的类别值。
>> iris['target']
array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])
数据集下载
加州大学欧文分校 (University of California, Irvine) 的数据仓库: