NO5 -- 抽样分布

抽样分布

抽样指按一定方式从总体中选择或抽出样本的过程。

  • 1.抽样作为人们从部分认识整体这一过程的关键环节,是实现“由部分认识总体”这一目标的途径和手段;
  • 2.抽样主要解决的是对象的选取问题,即如何从总体中选出一部分对象作为总体代表的问题。这样就有利于我们在研究中节省时间和成本,方便有效。

统计量

样本均值

样本均值是指在总体中的样本数据的均值,样本均值的计算依据是样本个数,反映的是样本数据集中趋势

样本方差

先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数,就叫做样本方差。样本方差用来表示一列数的变异程度。

样本变异系数

样本数据标准差与样本数据平均数的比

样本k阶矩

k阶原点矩是随机变量x“偏离”原点(0,0)的“距离”的k次方的期望值

样本K阶中心矩

k阶中心矩是随机变量x“偏离”其中心的“距离”的k次方的期望值。一般均以其平均数为“中心”。

二阶中心距,即作方差,它告诉我们一个随机变量在它均值附近波动的大小,方差越大,波动性越大。方差也相当于机械运动中以重心为转轴的转动惯量。

三阶中心距告诉我们一个随机密度函数向左或向右偏斜的程度。

样本偏度

样本三阶中心矩除以样本二阶中心矩的3/2次幂的商,记为Sk。

样本偏度常用作总体偏度的估计量和检验总体分布正态性的统计量.而总体偏度是一个描述总体分布不对称性的数字特征.正态分布是左右对称的,因而它的偏度为零.

样本峰度

样本四阶中心矩除以样本二阶中心矩平方的商再减去3,记为Ku。

样本峰度常用以作总体峰度的估计量.正态分布的峰度为零.非正态分布的峰度是以正态分布的峰度为标准来描述其分布密度形状为陡峭或平坦的一个数字特征.

抽样分布

中心极限定理

不论总体服从什么分布,只要从总体中抽取的样本足容量够大,这些样本组成的样本均值的抽样分布都近似于正态分布

卡方分布

相互独立的随机变量的标准正态分布的平方和,有几个随机变量自由度就是几。

在这里插入图片描述

从卡方分布图可以看出:卡方分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数 n 的增大;卡方分布趋近于正态分布;随着自由度n的增大,卡方分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大)。

T分布

偶函数,n趋近于无穷,近似于标准正态分布
假设X服从标准正态分布N(0,1),Y服从卡方 (n)分布,那么Z=X/sqrt(Y/n)的分布称为自由度为n的t分布,记为 Z~t(n)。
在这里插入图片描述

可以看出,t分布以0为中心,左右对称的单峰分布;t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线。

F分布

设X、Y为两个独立的随机变量,X服从自由度为n的卡方分布,Y服从自由度为m的卡方分布,这两个独立的卡方分布除以各自的自由度以后的比率服从F分布。即:

F = (x/n)/(y/m)
在这里插入图片描述
F分布是一种非对称分布;它有两个自由度,即n-1和m-1,相应的分布记为F( n–1,m-1), n-1通常称为分子自由度, m-1通常称为分母自由度;F分布是一个以自由度(n-1)和(m-1)为参数的分布族,不同的自由度决定了F 分布的形状。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值