1.箱线图
1. 什么是箱线图?
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。
可显示一组数据的最大值、最小值、中位数、以及四分位数 可以用来反映一组或多组连续型定量数据分布的中心位置和散布范围
四分位数(4-分位数)是3个数据点,把数据分布均匀划分成4部分,每部分包含25%的数据。Q1(称为下四分位数)和Q3(称为上四分位数)分别为数据排序后位于25%和75%位置上的值,Q2是中位数。
IQR=Q3-Q1
上限=Q3+1.5IQR 下限=Q1-1.5IQR
绘制步骤:
(1)计算上四分位数(Q3),中位数,下四分位数(Q1)
(2)计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range)Q3-Q1
(3)绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数。在箱子内部中位数的位置绘制横线。
(4)大于上四分位数1.5倍四分位数差的值,或者小于下四分位数1.5倍四分位数差的值,划为异常值(outliers),即Q3+1.5IQR&#x