1、箱线图介绍
统计指标一般包括:四分位数、均值、中位数、众数、方差、标准差等,箱线图作为一种数据统计的方法,内容包括:最小值,第一分位,中位数,第三分位数,最大值。
箱线图于1977年由美国著名 统计学家约翰·图基(John Tukey)发明,能够明确的展示离群点的信息,同时能够让我们了解数据是否对称,数据如何分组、数据的峰度。
箱线图(Box- plot)是一种用于显示一组数据分散情况的统计图,多用于多组数据的比较,相对于直方图,既可以节省空间,还可以展示更多信息(如均值、四分位数等)。
箱线图包含数学统计量,能够分析不同类别数据各层次水平差异,还可以揭示数据间离散程度、异常值、分布差异等。
箱线图内容详细介绍:
四分位数:
一组数据按照从小到大顺序排列后,把该组数据四等分的数,称为四分位数。第一四分位数 (Q1)、第二四分位数 (Q2,也叫“中位数”)和第三四分位数 (Q3)分别等于该样本中所有数值由小到大排列后第25%、第50%和第75%的数字。第三四分位数与第一四分位数的差距又称四分位距(interquartile range, IQR)。
(1)第一个四分位数Q1:也称作25th百分位数,表示最小数(不是“最小值”)和数据集的中位数之间的中间数。
(2)第二四分位数Q2:也称作中位数Median/50th百分位数,表示数据集的中间值。
(3)第三四分位数Q3:也称作75th百分位数,表示数据集的中位数和最大值之间的中间值(不是“最大值”)。
(4)四分位间距IQR:第25至第75个百分点的距离。
(5)离群值:Outliers
(6)最大值max、最小值min
利用正态分布的箱线图,可以帮助理解箱线图:
2 完整代码
function boxPlot3D(xx,g1,g2,quantDistribution)
%function boxPlot3D(xx,g1,g2,quantDistribution)
%--------------------------------------------------------------------------
% boxPlot3D(x) creates a three dimensional box plot of the data in x. If x
% is 3D a matrix, boxPlot3D creates one box for each column. Example,
% create a 3D matrix with normal distributions with different means:
%
% xx=randn(50,2,4)+repmat((permute([0 1 2 -2;1 2 3 4],[3 1 2])),[50,1,1]);
% boxPlot3D(xx)
%
% boxPlot3D(x,g1,g2) groups the data of x, with the grouping variables of
% g1, and g2. Example, create a 1D Matrix with different values and