鸢尾花数据集探索
一、认识数据
本案例使用到的鸢尾花(Iris)数据集是机器学习和统计学中一个经典的数据集。首先要加载数据,代码如下:
from sklearn.datasets import load_iris
iris_dataset = load_iris()
load_iris返回的iris对象是一个Bunch对象,与字典非常相似,里面包含键和值,通过iris_dataset.keys()查看键的情况,返回如下结果:
[‘data’, ‘target’, ‘frame’, ‘target_names’, ‘DESCR’, ‘feature_names’, ‘filename’, ‘data_module’]。
target_names键对应的值是一个字符串列表,里面包含了花的品种,target_names如下:[‘setosa’,