MATLAB 数据分析一: 描述样本数据的几个基本特征

本文介绍了统计分析中的基本概念,包括计算均值、中位数以了解数据集中间趋势,通过分位数把握数据分布,以及计算方差、标准差来衡量数据离散程度。此外,还讨论了三均值和极差、四分位极差作为数据变异性的指标。这些统计量在理解和解释数据集特性时起到关键作用。
摘要由CSDN通过智能技术生成

测试数据:

load yhdz.mat

yhdz如下:

yhdz = 3 4 5 6 7 7 89 8 90 11 22 3 45 77 66 88 87 44 2 23

1,均值:

mean(yhdz)

ans = 34.3500

2,中位数:排序后中间数据的值,若数据量为奇数,则为中间的数值;若数据量为偶数个,中位数为中间两个数的平均值。

median(yhdz)

ans = 16.5000

3,分位数:设0<= p < 1,则样本数据有p分位数的概念。事实上,p=0.5时,0.5分位数就是中位数,由此,可以推出分位数的概念。常见的分位数有 0.25分位数、0.5分位数(即中位数)、0.75分位数。其中 0.75分位数和 0.25分位数又分别称为 上、下四分位数, 呵呵,

上分位数(即 0.75分位数 ):

prctile(yhdz,75)

ans = 71.5000

下分位数(即0.25分位数):

prctile(yhdz,25)

ans = 5.5000

4,三均值:三均值是上四分位数、中位数和下四分位数的加权平均,权向量为(0.25, 0.5, 0.25).

w=[0.25,0.5,0.25];

sanjunzhi = w * prctile(yhdz, [25,50,75])'

sanjunzhi = 27.5000

5,方差与标准差:

方差:方差是描述数据取值分散性的一种度量,它是数据相对于均值的差值平方的平均。

var(yhdz)

ans = 1.2303e+03

标准差:方差的算术平方根。

std(yhdz)

ans = 35.0763

6,极差与四分位极差:

极差:样本最大值与最小值的差。

range(yhdz)

ans = 88

四分位极差:样本上、下四分位数极差。

iqr(yhdz)

ans = 66

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值