matlab中一组数取百分位数_GRE数学难题-正态分布+百分位数

本文介绍了正态分布、百分位数的基本概念,包括算术平均数、中位数、四分位数和百分位数的计算。在MATLAB中,这些概念用于分析数据分布。正态分布图的关键特征是中位数、平均数和百分位数的位置,它们在图形中具有特定的面积含义。文章通过例题解释了如何根据正态分布图找到特定百分位数,强调了连续随机变量的性质及其在处理数据时的重要性。
摘要由CSDN通过智能技术生成

1 基本概念

在图标题中考察正态分布和百分位数时,通常会涉及以下基本概念

算术平均值(arithmetic) = 平均值(average) = 均值(mean) - 容易受极值影响

加权平均数 = Σ(权重 * 数值) / Σ 权重 - 容易受极值影响

权重 = 出现次数 = 频率

中位数(median) - 不容易受极值影响

计算n个数字的中位数时,先将数字从小到大进行排序得到一个有序数列。

如果n是奇数,中位数就是有序数列最中间的那个数。

如果n是偶数,最中间便有两个数。中位数就是这两个数的平均数

指在这组数据中出现次数最多的那个数

四分位数和百分位数

用L指代最小的数,G指代最大的数M指代中位数。

一组数据中最常见的位置是四分位数和百分位数

可以将一组从小到大排列好的数据分成若干个大致相同的部分。

一组数据中有3个四分位数把这组数据分为4个部分,

有99个百分位这组数据分成100个大致相同的部分

和平均数、中位数一样,四分位数和百分位数可能不是该组数据中出现的值

3个4分位数依次为Q1,Q2,Q3

则Q2 = M

99个100分位数依次为P1,... P50,... P99

M=Q2=P50

四分位数距( interquartile range)

第一个四分位数和第三个四分位数之间的差值,即Q3 - Q1

极差(range) = max-min

标准差( standard deviation)

与极差和四分位距有所不同,标准差(standard deviation)与一组数据中每个数据都有联系。

数据偏离平均值越远,标准差就越大

数据越集中在平均值附近,标准差就越小

n个数据的标准差:

(1)计算n个值的平均值

n'

(2)计算每个数据与平均值的差

d1 = n1 - n',

d2 = n2 - n',

...

dn = n - n'

(3)标准差=((d1^2+ d2^2 + ...+dn^2) /n)^(0.5)

样本标准差(sample standard deviation) = 总体标准差(population standard deviation)

=((d1^2+ d2^2 + ...+dn^2) /(n-1))^(0.5)

频率直方图 / 柱状图

如果柱状图每个柱子的底宽为1,则

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值