Matlab创建三维箱线图

本文详细介绍了箱线图的概念,包括四分位数的定义,并提供了由John Tukey发明的箱线图在数据统计中的作用。通过一个完整的Matlab函数`boxPlot3D`代码示例,展示了如何在三维空间中绘制箱线图,帮助理解数据的分布、离群值和不同组间的差异。
摘要由CSDN通过智能技术生成

1、箱线图介绍

统计指标一般包括:四分位数、均值、中位数、众数、方差、标准差等,箱线图作为一种数据统计的方法,内容包括:最小值,第一分位,中位数,第三分位数,最大值。

箱线图于1977年由美国著名 统计学家约翰·图基(John Tukey)发明,能够明确的展示离群点的信息,同时能够让我们了解数据是否对称,数据如何分组、数据的峰度。

箱线图(Box- plot)是一种用于显示一组数据分散情况的统计图,多用于多组数据的比较,相对于直方图,既可以节省空间,还可以展示更多信息(如均值、四分位数等)。

箱线图包含数学统计量,能够分析不同类别数据各层次水平差异,还可以揭示数据间离散程度、异常值、分布差异等。

箱线图内容详细介绍:

四分位数:

一组数据按照从小到大顺序排列后,把该组数据四等分的数,称为四分位数。第一四分位数 (Q1)、第二四分位数 (Q2,也叫“中位数”)和第三四分位数 (Q3)分别等于该样本中所有数值由小到大排列后第25%、第50%和第75%的数字。第三四分位数与第一四分位数的差距又称四分位距(interquartile range, IQR)。

(1)第一个四分位数Q1:也称作25th百分位数,表示最小数(不是“最小值”)和数据集的中位数之间的中间数。

(2)第二四分位数Q2:也称作中位数Median/50th百分位数,表示数据集的中间值。

(3)第三四分位数Q3:也称作75th百分位数,表示数据集的中位数和最大值之间的中间值(不是“最大值”)。

(4)四分位间距IQR:第25至第75个百分点的距离。

(5)离群值:Outliers

(6)最大值max、最小值min

利用正态分布的箱线图,可以帮助理解箱线图:

2 完整代码

function boxPlot3D(xx,g1,g2,quantDistribution)

%function boxPlot3D(xx,g1,g2,quantDistribution)

%--------------------------------------------------------------------------

% boxPlot3D(x) creates a three dimensional box plot of the data in x. If x

% is 3D a matrix, boxPlot3D creates one box for each column. Example,

% create a 3D matrix with normal distributions with different means:

%

% xx=randn(50,2,4)+repmat((permute([0 1 2 -2;1 2 3 4],[3 1 2])),[50,1,1]);

% boxPlot3D(xx)

%

% boxPlot3D(x,g1,g2) groups the data of x, with the grouping variables of

% g1, and g2. Example, create a 1D Matrix with different values and

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值