非参数kernel核密度方法python_Python可视化 | Seaborn5分钟入门(一)——kdeplot和distplot...

Seaborn是基于matplotlib的Python数据可视化库,提供高级接口绘制统计图形。本文介绍了如何使用Seaborn的kdeplot和distplot函数,包括核密度估计图和直方图的绘制,以及相关参数的使用方法。通过实例展示了如何控制直方图的划分、是否显示直方图和核密度估计、添加颜色棒等特性。
摘要由CSDN通过智能技术生成

Seaborn是基于matplotlib的Python可视化库。 它提供了一个高级界面来绘制有吸引力的统计图形。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,不需要经过大量的调整就能使你的图变得精致。

c0fd91722d383a7509793fee50116247.png

Seaborn的安装

>>>pip install seaborn

安装完Seaborn包后,我们就开始进入接下来的学习啦,首先我们介绍kdeplot的画法。

注:所有代码均是在IPython notebook中实现


kdeplot(核密度估计图)

核密度估计(kernel density estimation)是在概率论中用来估计未知的密度函数,属于非参数检验方法之一。通过核密度估计图可以比较直观的看出数据样本本身的分布特征。具体用法如下:

seaborn.kdeplot(data,data2=None,shade=False,vertical=False,kernel='gau',bw='scott',gridsize=100,cut=3,clip=None,legend=True,cumulative=False,shade_lowest=True,cbar=False, cbar_ax=None, cbar_kws=None, ax=None, *kwargs)

我们通过一些具体的例子来学习一些参数的用法:

首先导入相应的库

%matplotlib inline import numpy as np import seaborn as sns sns.set()

绘制简单的一维kde图像

x=np.random.randn(100) #随机生成100个符合正态分布的数sns.kdeplot(x)
95ad4df4c380d831c565e0842a07a61b.png

cut:参数表示绘制的时候,切除带宽往数轴极限数值的多少(默认为3)

sns.kdeplot(x, cut=0)
dc328e1d172f488d38c670c751c7f6d3.png

cumulative :是否绘制累积分布

sns.kdeplot(x, cumulative=True)
f3405884232ed1464b64b5b11ba6ff78.png

shade:若为True,则在kde曲线下面的区域中进行阴影处理,color控制曲线及阴影的颜色

sns.kdeplot(x, shade=True, color="g")
2eb099e003f3b1260b0da9bedc8e29d6.png

vertical:表示以X轴进行绘制还是以Y轴进行绘制

sns.kdeplot(x, vertical=True)
37945f0f8e9dd7884e7aa832d4101ddb.png

二元kde图像

y=np.random.randn(100)sns.kdeplot(x, y, shade=True)
9d7ccb7da8ccf1ce6734ab5e38f4fe46.png

cbar:参数若为True,则会添加一个颜色棒(颜色帮在二元kde图像中才有)

sns.kdeplot(x, y, shade=True, cbar=True)
c79c1d377f697dc5a511feecd9dbaf37.png

接下来,我们接着学习功能更为强大的distplot


distplot

displot()集合了matplotlib的hist()与核函数估计kdeplot的功能,增加了rugplot分布观测条显示与利用scipy库fit拟合参数分布的新颖用途。具体用法如下:

seaborn.distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None, hist_kws=None, kde_kws=None, rug_kws=None, fit_kws=None, color=None, vertical=False, norm_hist=False, axlabel=None, label=None, ax=None)

先介绍一下直方图(Histograms):

直方图又称质量分布图,它是表示资料变化情况的一种主要工具。用直方图可以解析出资料的规则性,比较直观地看出产品质量特性的分布状态,对于资料分布状况一目了然,便于判断其总体质量分布情况。直方图表示通过沿数据范围形成分箱(bin),然后绘制条以显示落入每个分箱的观测次数的数据分布。

接下来还是通过具体的例子来体验一下distplot的用法:

sns.distplot(x,color="g")
44ca4cce606db172291fbe2f5851ad83.png

通过histkde参数调节是否显示直方图及核密度估计(默认hist,kde均为True)

import matplotlib.pyplot as plt#创建一个一行三列的画布fig,axes=plt.subplots(1,3) sns.distplot(x,ax=axes[0]) #左图sns.distplot(x, hist=False, ax=axes[1]) #中图sns.distplot(x, kde=False, ax=axes[2]) #右图
bdef35d5b88fb37cde105295d94e7dcd.png

bins:int或list,控制直方图的划分

fig,axes=plt.subplots(1,2) #左图:分成20个区间sns.distplot(x, kde=False, bins=20, ax=axes[0])  #右图:以0,1,2,3为分割点,形成区间[0,1],[1,2],[2,3],区间外的值不计入。sns.distplot(x,kde=False,bins=[x for x in range(4)],ax=axes[1])
e8e259955fe5206c2585225d591eb7ac.png

rag:控制是否生成观测数值的小细条

fig,axes=plt.subplots(1,2)sns.distplot(x,rug=True,ax=axes[0]) #左图sns.distplot(x,ax=axes[1]) #右图
b89330cf6e77e06a4537151c7c06047f.png

fit:控制拟合的参数分布图形,能够直观地评估它与观察数据的对应关系(黑色线条为确定的分布)

from scipy.stats import *sns.distplot(x, hist=False, fit=norm) #拟合标准正态分布
0a5f8b2382a6fae008f7108171891fa0.png

hist_kws, kde_kws, rug_kws, fit_kws参数接收字典类型,可以自行定义更多高级的样式

sns.distplot(x, kde_kws={"label":"KDE"}, vertical=True,color="y")
dc766d9e57f7219ae8fc6f965c9f5074.png

norm_hist:若为True, 则直方图高度显示密度而非计数(含有kde图像中默认为True)

fig,axes=plt.subplots(1,2)sns.distplot(x, norm_hist=True, kde=False, ax=axes[0]) #左图sns.distplot(x, kde=False, ax=axes[1]) #右图
edcb4a73670f7fb63558d144c147eb1b.png

还有其他参数就不在此一一介绍了,有兴趣继续深入学习的同学可以查看Seaborn的官方文档。以上内容是我结合官方文档和自己的一点理解写成的,有什么错误大家可以指出来并提提意见共同交流、进步,也希望我写的这些能够给阅读完本文的你或多或少带来一点帮助!

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值