鸢尾花数据集探索

本文详细介绍了鸢尾花数据集,包括数据加载、特征和标签的含义,以及数据的划分。使用sklearn库进行训练集和测试集的分割,并通过k近邻算法构建分类模型。通过散点图矩阵展示了数据可视化,验证了模型的可行性。最后,模型在测试集上取得了97%的精度,展示了k近邻算法在鸢尾花分类问题上的效果。
摘要由CSDN通过智能技术生成

一、认识数据

本案例使用到的鸢尾花(Iris)数据集是机器学习和统计学中一个经典的数据集。首先要加载数据,代码如下:

from sklearn.datasets import load_iris
iris_dataset = load_iris()

load_iris返回的iris对象是一个Bunch对象,与字典非常相似,里面包含键和值,通过iris_dataset.keys()查看键的情况,返回如下结果:
[‘data’, ‘target’, ‘frame’, ‘target_names’, ‘DESCR’, ‘feature_names’, ‘filename’, ‘data_module’]。
target_names键对应的值是一个字符串列表,里面包含了花的品种,target_names如下:[‘setosa’,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值