Seaborn 分布绘图
Seaborn是基于 Matplotlib 的图形可视化库。该库提前定义好了一套自己的风格,也封装了一系列的方便的绘图函数,之前通过 matplotlib 需要很多代码才能完成的绘图,使用 seaborn 可能就是一行代码的事情。总结一句话:使用 seaborn 绘图比 matplotlib 更美观、简单。
3. 分布绘图
分布绘图分为单一变量分布,多变量分布,成对绘图。
3.1 单变量分布
单一变量主要就是通过直方图来绘制。在 seaborn 中直方图的绘制采用的是 distplot ,其中 dist 是 distribution 的简写,不是 histogram 的简写。 distplot 不仅仅可以绘制直方图,还可以绘制 KDE 曲线以及 rug 线。该函数有以下常用参数:
(1) kde(核密度曲线):这个代表是否要显示 kde 曲线,默认是显示的,如果显示 kde 曲线,那么 y 轴表示的就是概率,而不是数量。也可以设置为 False
(2) bins:代表的这个直方图显示的数量,也可以通过自己设置
(3) rug:代表是否需要显示底部的胡须下线,下面的胡须线越密集的地方,说明数据量越多。
(4) hist:设置为False不展示直方图
#开启默认样式
sns.set(color_codes=True)
the_titanic = titanic[~np.isnan(titanic['age'])]
#查看titanic数据集中年龄的分布情况
sns