python导入鸢尾花数据集_python数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析...

本文是关于Python数据挖掘的学习笔记,重点分析鸢尾花数据集。通过可视化图表,包括直方图、散点图、KDE图、箱图等,展示鸢尾花的特征关系。此外,文章还探讨了线性回归和决策树在鸢尾花数据集上的应用,以及KMeans聚类分析。
摘要由CSDN通过智能技术生成

#2018-04-05 16:57:26 April Thursday the 14 week, the 095 day SZ SSMR

python数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析

1.鸢尾花数据集可视化分析

2.线性回归分析鸢尾花花瓣长度和宽度的关系

3.决策树分析鸢尾花数据集

4.Kmeans聚类分析鸢尾花数据集

一. 鸢尾花数据集介绍

本章采用Python的Sklearn机器学习库中自带的数据集——鸢尾花数据集。简单分析数据集之间特征的关系图,

根据花瓣长度、花瓣宽度、花萼长度、花萼宽度四个特征进行绘图。

本章采用Python的Sklearn机器学习库中自带的数据集——鸢尾花数据集。简单分析数据集之间特征的关系图,根据花瓣长度、花瓣宽度、花萼长度、花萼宽度四个特征进行绘图。

#导入数据集iris

from sklearn.datasets import load_iris

#载入数据集

iris = load_iris()

#输出数据集

#print iris.data

target是一个数组,存储了data中每条记录属于哪一类鸢尾植物,数组长度是150,数组元素的值因为共有3类鸢尾植物,所以不同值只有3个。种类:

Iris Setosa(山鸢尾)

Iris Versicolour(杂色鸢尾)

Iris Virginica(维吉尼亚鸢尾)

二. 可视化分析鸢尾花

数据可视化可以更好地了解数据,主要调用Pandas扩展包进行绘图操作。

首先绘制直方图,直观的表现花瓣、花萼的长和宽特征的数量,纵坐标表示汇总的数量,横坐标表示对应的长度。

import pandas

#导入数据集iris

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"

names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']

dataset = pandas.read_csv(url, names=names) #读取csv数据

print(dataset.describe())

#直方图 histograms

dataset.hist()

接下来通过dataset.plot()绘制散点图,这里设置三个参数,显示的x坐标、y坐标和设置绘图种类。

import pandas

#导入数据集iris

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"

names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']

dataset = panda

  • 3
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值