![43c30b00e436b1ef041ad0aad1ea5b7b.png](https://img-blog.csdnimg.cn/img_convert/43c30b00e436b1ef041ad0aad1ea5b7b.png)
箱线图,可为数据样本提供汇总统计量的可视化表示。在科研中,对离散数据进行分析时有时会用到,笔者在论文中也时而看到。
下图是笔者在文献中看到的,横坐标是不同模型计算结果的对比,使用的就是箱线图[1]。
![4994c1350e566607d96061f09d9f9180.png](https://img-blog.csdnimg.cn/img_convert/4994c1350e566607d96061f09d9f9180.png)
因为见得不多,先对图及相关术语进行解释。
1 箱线图定义
对于给定数值数据,对应的箱线图显示以下信息:中位数、下四分位数和上四分位数、任何离群值(使用四分位差计算得出)以及不是离群值的最小值和最大值。
一个典型的箱线图如下所示[2]
![205b2235464b28f0f34a6d83202c9018.png](https://img-blog.csdnimg.cn/img_convert/205b2235464b28f0f34a6d83202c9018.png)
框的中间线为样本中位数,用m表示;
每个框的上边缘和下边缘分别表示上四分位数和下四分位数;对于任意一组数据,将其按照从小到大按顺序排列后,第25%的数为上四分位数,第50%数为中位数,第75%数为下四分位数;顶部和底部边缘之间的距离表示四分位差,用IQR表示;
离群值是指距离框的顶部或底部超过1.5IQR的值;
须线是延伸到每个框的上方和下方的线条。一条须线将上四分位数与最大非离群值(不是离群值的最大值)相连,另一条须线将下四分位数与最小非离群值(不是离群值的最小值)相连。
缺口区域的顶部和底部边缘分别对应于