自带的数据集_python可视化分析鸢尾花数据集

本文使用Python的Sklearn库中的鸢尾花数据集进行数据分析,通过直方图展示花瓣和花萼的长度与宽度特征,并用散点图进一步揭示各特征间的关系。数据集包含150个样本,涉及山鸢尾、变色鸢尾和维吉尼亚鸢尾三个类别。通过Pandas和Matplotlib进行数据可视化,帮助理解数据分布。
摘要由CSDN通过智能技术生成

同学们你们好,猫老师又来更新了,我们在做数据分析的这个过程中,所用的数据集可以来源于实际的案例,也可以从网上寻找公开的数据资源,当然也可以编码生成一个随机数据集。本章采用Python的Sklearn机器学习库中自带的数据集——鸢尾花数据集。简单分析数据集之间特征的关系图,根据花瓣长度、花瓣宽度、花萼长度、花萼宽度四个特征进行绘图。

Iris plants data set数据集可以从Sklearn包里面直接拿到,也可以从KEEL dataset数据集网站获取。数据集共包含4个特征变量、1个类变量,一共有150个样本。类别变量分别对应鸢尾花的三个亚属,分别是山鸢尾 (Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。

数据可视化可以更好地了解数据,主要调用Pandas扩展包进行绘图操作。

首先绘制直方图,直观的表现花瓣、花萼的长和宽特征的数量,纵坐标表示汇总的数量,横坐标表示对应的长度。

import pandas

#导入数据集iris

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"

names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']

dataset = pandas.read_csv(url, names=names) #读取csv数据

print

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值