相较散点图和折线图,柱状图、饼图、箱线图(箱型图)是另外 3 种数据分析常用的图形,主要用于分析数据内部的分布状态或分散状态。其中箱线图(箱型图)的主要作用是发现数据内部整体的分布分散情况,包括上下限、各分位数、异常值。
与之前的可视化博客内容不同的是,这里我们需要先介绍一下箱线图上各部位的含义:
Matplotlib 中绘制箱线图的函数为 boxplot () ,有两种语法,如下:
常用语法:
matplotlib.pyplot.
boxplot
(x, notch=None, sym=None, vert=None, whis=None, positions=None, widths=None, patch_artist=None, bootstrap=None, usermedians=None, conf_intervals=None, meanline=None, showmeans=None, showcaps=None, showbox=None, showfliers=None, boxprops=None, labels=None, flierprops=None, medianprops=None, meanprops=None, capprops=None, whiskerprops=None, manage_xticks=True, autorange=False, zorder=None, hold=None, data=None)
常用参数及说明:
参数 | 说明 | 参数 | 说明 |
x | 指定要绘制箱线图的数据; | showcaps | 是否显示箱线图顶端和末端的两条线 |
notch | 是否是凹口的形式展现箱线图 | showbox |