python数据可视化的特点_Python数据分析以及可视化

引入网址:https://www.kaggle.com/benhamner/d/uciml/iris/python-data-visualizations/notebook

import matplotlib.pyplot as plt

import seaborn as sns

import pandas as pd

导入数据:

iris=pd.read_csv('E:\\data\\Iris.csv')

iris.head()

6631753860956476584.png

作直方图:

plt.hist(iris['SepalLengthCm'],bins=15)

plt.xlabel('SepalLengthCm')

plt.ylabel('quantity')

plt.title('distribution of SepalLengthCm')

plt.show()

6631638412235568059.png

作散点图:

6631683492212291560.png

但是这样的图并没有将其中的不同种类话=花的颜色标明出来。所以我们使用另一种方式,通过Species来分类

6631714278537880665.png

小提琴图

6631658203444861646.png

箱型图:

ax=sns.boxplot(x="Species",y="SepalWidthCm",data=iris)

6631606526398363841.png

这里使用jitter=True使得所有点不全落在中间的这条垂直线上

ax=sns.boxplot(x="Species",y="SepalWidthCm",data=iris)

ax=sns.stripplot(x="Species",y="SepalWidthCm",data=iris,jitter=True,edgecolor="gray")

6631808836537879675.png

kdeplot:单变量之间的联系,并通过一个核密度评估变量潜在的特征

6631519664979769329.png

显示两个变量之间的联系:

6631635113700685621.png

通过diag_kind='kde'显示双变量间的核密度并用其估计其特征

6631601028840226656.png

boxplot_1:通过Species将变量间的各个特征分离出来

6631476784026292983.png

Andrews curves:安德鲁曲线使用样本的属性作为傅里叶变换的系数

6631525162537908737.png

Radviz:多变量可视化,每一个特征都在一个平面上显示出来,样本通过圈上的点与之像联系起来

6631569143003014552.png

parallel_coordinates通过平行坐标进行多变量可视化:对于数据样本的每一个特征,我们通过在坐标轴上设置特征并通过画线的方式来进行设置

6631549351793735984.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值