参考资料:
箱线图是什么?
箱线图(boxplot)也可称为盒式图、盒须图,也是用于描述数据分布特征的一种图形,常用于显示未分组原始数据的分布。
箱线图由一组数据的5个特征值绘制而成,形式上它由一个箱子和两条线段组成,其绘制方法是:首先找出一组数据的5个特征值,即最大值、最小值、中位数(mean或Q2)和两个四分位数(下四分位数或QL或Q1,上四分位数或QU或Q3),连接两个四分位数画出箱子,再将两个极值点与箱子相连接。
箱线图的作用
通过将多组数据的箱线图画在同一坐标上,则可以清晰地显示出各组数据的分布差异,为发现问题、改进流程提供突破点。在各种领域中也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,其次还可以进行多组数据分布特征的比较。
可以展示多组数据的变异性或分散性信息。箱形图是一张图表,它为您很好地指示数据中的值如何分布,尽管与直方图或密度图相比,箱线图似乎是原始的,但它们具有占用较少空间的优势,这在比较许多组或数据集之间的分布时非常有用。
用于识别异常值[Outliers]:
异常值通常被定义为小于“Q1-1.5*IQR”或大于"Q3+1.5*IQR"的值,这里「Q1-1.5*IQR」也被称为下限值,这里「Q3+1.5*IQR」也被称为上限值。
excel操作如下:
1、利用股价图,模拟箱线图,“成交量”对应“平均数”,“开盘”对应“下四份位数”,“盘高”对应“最大值”,“盘低”对应“最小值”,“收盘”对应“上四分位数”。
2、插入图表,选择股价图中的“成交量-开盘-盘高-盘低-收盘图”
3、将主坐标轴和副坐标轴的边界设置为一致
4、选择柱形图,右键,选择“更改系列图表类型”,将平均数的图表类型调整为“带数据标签的折线图”
5、选择折线图,将线条设置为“无线条”,标记选择“内置”的“—”,通过设置标记大小,将标记设置为合适长度。
6、用上一步设置平均数标记的方法,设置最大值和最小值的标记,完成操作。