零基础理解抽样分布

抽样分布


定义:样本统计量的概率分布,是一种理论分布。
——在重复选取容量为 n 的样本时,由该统计量的所有可能取值形成的相对频数分布。

意义:提供了样本统计量长远而稳定的信息,是进行统计推断的理论基础,也是抽样推断科学性的重要依据。

1 样本统计量

简称统计量,指的是样本的函数,并且此函数不含有未知参数。常见的统计量有:样本均值,样本方差,样本极差等。

样本统计量是随机变量!!!

虽然总体参数是一个固定的值,但由于抽样的随机性,用来估计总体参数的样本统计量是一个随机变量。而想要全面、准确的刻画一个随机变量的所有特征,必须依赖于该随机变量的统计分布和概率密度函数。

2 正态分布

高斯分布,自然界中最重要最基本的分布。

正态分布的标准化(简化计算概率的工作)

3 三大抽样分布

有很多统计推断是基于正态分布的假设,以标准正态分布变量为基石而构造的三个著名统计量在实际中有广泛的应用,这是因为这三个统计量不仅有明确背景,而且其抽样分布的密度函数有显式表达式,它们被称为统计中的“三大抽样分布”。这三大抽样分布即为著名的卡方分布,t分布和F分布。

参考: https://blog.csdn.net/anshuai_aw1/article/details/82735201

3.1 卡方分布

假设 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) XN(μ,σ2),则 z = X − μ σ ∼ N ( 0 , 1 ) z=\frac{X-\mu}{\sigma} \sim N(0,1) z=σXμN(0,1),令 Y = z 2 Y=z^2 Y=z2,则 Y Y Y服从自由度为1的 χ 2 \chi^2 χ2分布, Y ∼ χ 2 ( 1 ) Y \sim \chi^2(1) Yχ2(1)

若随机变量 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn相互独立,且均服从标准正态分布,则它们的平方和:
∑ i = 1 n X i 2 ∼ χ 2 ( n ) \sum_{i=1}^{n}X_i^2 \sim\chi^2(n) i=1nXi2χ2(n)其概率密度函数及图像为
χ 2 \chi^2 χ2的重要特征:

  1. 分布的变量值始终为正;
  2. 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称;
  3. 期望为 E ( χ 2 ) = n E(\chi^2)=n E(χ2)=n,方差为 D ( χ 2 ) = 2 n D(\chi^2)=2n D(χ2)=2n (n为自由度);
  4. 可加性:若 U ∼ χ 2 ( n 1 ) , V ∼ χ 2 ( n 2 ) U \sim \chi^2(n_1),V \sim \chi^2(n_2) Uχ2(n1),Vχ2(n2),则U+V这一随机变量服从自由度为 n 1 + n 2 n_1+n_2 n1+n2 χ 2 \chi^2 χ2分布。

3.2 t分布

设随机变量 X 服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1),随机变量 Y 服从自由度为 n 的 χ 2 \chi^2 χ2 分布,且 X,Y 相互独立,则:
t = X Y / n t=\frac{X}{\sqrt{Y/n}} t=Y/n X
服从自由度为n的t分布。

t 分布的概率密度函数
f ( t ) = Γ ( ν + 1 2 ) ν π ⋅ Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 ( ν ,   d e g r e e s   o f   f r e e d o m ) f(t)=\frac{\Gamma(\frac{\nu+1}{2})}{\sqrt{\nu\pi}·\Gamma(\frac{\nu}{2})}(1+\frac{t^2}{\nu})^{-\frac{\nu+1}{2}} \quad (\nu,\ degrees\ of\ freedom) f(t)=νπ Γ(2ν)Γ(2ν+1)(1+νt2)2ν+1(ν, degrees of freedom)

伽马函数: $\Gamma(x)= \int_{0}{\infty}{t}{x-1}e^{-t}dt\ (x>0) , 简 单 性 质 : , 简单性质: ,\Gamma(x+1)=x\Gamma(x)$。

在这里插入图片描述

3.3 F分布

U ∼ χ 2 ( n 1 ) , V ∼ χ 2 ( n 2 ) U \sim \chi^2(n_1),V \sim \chi^2(n_2) Uχ2(n1)Vχ2(n2),且U和V相互独立,则:
F = U / n 1 V / n 2 F=\frac{U/n_1}{V/n_2} F=V/n2U/n1
称F为服从自由度n1和n2的F分布,记为 F ∼ F ( n 1 , n 2 ) F \sim F(n_1,n_2) FF(n1,n2)

在这里插入图片描述

4 统计量的抽样分布

4.1 样本均值的抽样分布

正态变量线性函数的分布

在这里插入图片描述

此处随机变量 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn可看做有放回的从总体中抽取 n 个个体的观测值,因此 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn是独立同分布的。再结合期望和方差的运算法则,即可得到上述表示。

正态分布再生定理

当总体服从正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)时,来自该总体的容量为 n 的样本均值 x ‾ \overline{x} x 也服从正态分布, x ‾ \overline{x} x 的数学期望为 μ \mu μ,方差为 σ 2 / n \sigma^2/n σ2/n,即 x ‾ ∼ N ( μ , σ 2 / n ) \overline{x} \sim N(\mu,\sigma^2/n) xN(μ,σ2/n)

由此可见,正态分布再生定理实际上就是正态变量线性函数分布的特殊形式。

中心极限定理

在这里插入图片描述

4.2 样本比例的抽样分布

在这里插入图片描述

4.3 样本方差的抽样分布

在这里插入图片描述

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值