箱线图 (BoxPlot)也称为箱形图、箱须图或盒式图等,是用于显示一组数据分散情况的统计图,最初由美国数学家JohnTukey于1970年提出(也是提出著名Tukey检验的那位),至今已整整半个世纪。它能同时反映数据统计量和整体分布,成为现在最常用的统计图形之一。
箱线图因形状如箱子而得名,“箱子”从上到下展示的是上四分位数(75thQuantile,箱子上边线)、中位数(median,箱子中间的线)和下四分位数(25thQuantile,箱子的下边线),其中上四分位数和下四分位数之间的距离称为四分位距(Inter-QuartileRange,IQR),“胡须”即延伸线,延伸至除离群值外的最大值和最小值,超出上下四分位数1.5倍IQR的值被认为是离群值。
关于箱线图其它的一些基本情况大家可以参见我们以前的推送《试验研究中的利器--强大的直方图和箱线图》。这种漂亮的展示图还发展出许多变体,是数据可视化的重要工具,也帮助克服了传统箱线图的一些缺陷。今天小编就给大家介绍一些常用的