欢迎关注”生信修炼手册”!
在查看一个数据的分布时,常用的可视化形式有直方图,密度分布图等,在seaborn中,相关的函数有以下几个
1. histplot. 通过直方图来展示数据分布
2. kdeplot, 通过密度分布图来展示数据分布
3. ecdfplot. 通过累积分布曲线来展示数据分布
4. rugplot. 通过x轴和y轴的边际分布来展示数据分布
下面通过一些基本的例子来感受下各自的可视化形式,histplot示例如下
>>> df = pd.read_csv('penguins.csv')
>>> sns.histplot(df, x='flipper_length_mm')
>>> plt.show()
输出结果如下
kedplot示例如下
>>> sns.kdeplot(data=df, x='flipper_length_mm')
>>> plt.show()
输出结果如下
ecdfplot示例如下
>>> sns.ecdfplot(data=df, x='flipper_length_mm')
>>> plt.show()
输出结果如下
rugplot示例如下
>>> sns.rugplot(data=df, x='flipper_length_mm')
>>> plt.show()
输出结果如下
在实际使用中,histplot和kdeplot是使用的最高频的,其次是rugplot, 最后是ecdfplot。对于这一类函数而言,有许多的通用参数,以histplot为例,来看下这些参数的作用
1. x和y
数据分布通常是