ViolinplotViolinplot相当于结合了箱形图与核密度图,更好地展现出数据的量化形态。展示如下:
R
1
2
3
plt.figure(1,figsize=(12,12))
foriinrange(4):
plt.show()
Violinplot用kernel density estimate去更好地描述了quantitative变量的分布。
与此同时,也可以组合swarmplot和boxplot或violinplot去描述quantitative变量。用鸢尾花数据集展示如下:
R
1
2
3
4
In[8]:
plt.figure(1,figsize=(12,12))
plt.title(str(var[i])+' in Iris species')
plt.show()
BarplotBarplot主要是展现在分类中的quantitative变量的平均值情况,并且用了boostrapping算法计算了估计值的置信区间和error bar.用鸢尾花数据集展示如下:
R
1
plt.show()
Countplot如果想知道在每个类别下面有多少个观察值,用countplot就可以,相当于是做一个observation counts,用鸢尾花数据集展示如下:
R
1
plt.show()
PointplotPointplot相当于是对barplot做了一个横向延伸,一方面,用point estimate和confidence level去展示barplot的内容;另一方面,当每一个主类别下面有更细分的sub-category的时候,pointplot可以便于观察不同sub-category在各主类别之间的联系。展示如下:
R
1
plt.show()
FactorplotFactorplot可以说是seaborn做category visualization的精髓,前面讲的这些plot都可以说是factorplot的具体展示。我们可以用PariGrid去实现对多个类别的数值特征用同一种plot做可视化。
R
1
2
g.map(sns.violinplot,palette='pastel')
plt.show()
附上各plot function的API,今后将会对API中的参数结合tutorial讲讲,如何做出更好的可视化效果。更新ing
R
1
seaborn.stripplot(x=None,y=None,hue=None,data=None,order=None,hue_order=None,
小结
seaborn是一个很棒的可视化库,尤其是当数据维度很大的时候,seaborn可以让我们用最少的代码去绘制一些描述性统计的图,便于找寻各维度变量之间的特征。此篇文档也是我对seaborn的学习笔记,这次整理的内容是关于category visualization。