【笔记】概统论与数理统计第七章知识点总结

7.1 总体与样本

  • 总体:全体被研究对象
  • 个体:每个被研究对象
  • 为了研究总体的性质, 我们假设可以从总体中随机抽取独立的样本. 通过分析样本, 我们推断总体的性质
  • 抽样需满足的条件
    • 随机性
    • 独立性
  • 样本:设随机变量X_1, X_2,...,X_n与总体 X 独立同分布, 则称X_1, X_2,...,X_n为一样本空间容量为 n 的来自总体 X 的简单随机样本(样本)

  • 样本观测值X_1, X_2,...,X_n的取值x_1, x_2,...,x_n

7.2 χ2 分布, t 分布与 F 分布

  • 𝝌𝟐分布:X_1, X_2,...,X_n独立同分布于标准正态分布 N(0, 1), 称随机变量

        所服从的分布为自由度为 n 的\chi^2 分布, 记为\chi^2 ∼ \chi^2(n)

  • 定理 1:\chi^2 - \Gamma(\frac{n}{2}, \frac{1}{2}),有密度函数

  • 𝝌𝟐分布的性质

    • 可加性:若\chi _i^2~\chi^2(n_i),i=1,2,…,n,\chi_1^2,...,\chi_n^2相互独立,则

  • t分布:设随机变量 X ∼ N(0, 1), Y ∼ \chi^2(n), 且 X 与 Y 独立,称随机变量

    所服从的分布为自由度为 n 的 t 分布, 记为 t ∼ t(n)
    • 密度曲线为偶函数,关于y轴对称
    • 当 n 充分大时 (n ≥ 45), t 分布就近似等于标准正态分布
    • D(X) = \frac{n}{n-2}
  • F分布:设随机变量 X ∼ \chi^2(n), Y ∼ \chi^2(m), 且 X 与 Y 独立, 称随机变量所服从的分布为自由度为 (n, m) 的 F 分布,记为F ∼ F(n, m)

    • n:第一自由度
    • m:第二自由度
    • 当 F ∼ F(n, m) 时, 1/F ∼ F(m, n)
  • 分布的分位点

    • 在随机变量 X 的分布已知时, 在概率论中, 对给定的实数 a,常需要计算概率 P(X ≤ a) = p; 而在数理统计中, 常常需要对给定的 0 < p < 1, 求出使 P(X ≤ a) = p 成立的实数 a

    • 分位点:设X是随机变量,分布是F,0 < p < 1, 若实数a_p满足

                则称a_p为 X(或 F) 的 p 分位点

             

  • 查找分位点e.g. α = 0.05,自由度为n

    • Z分布查表
      • 对于单侧检验:1-α = 0.95 → 在表中找到0.95,对应读取x,y的值相加即为Zα
      • 对于单侧检验:1-\frac{\alpha}{2} =  0.975 → 在表中找到0.975,读取对应的x,y值相加
    • t分布查表:当n>45时,可用正态分布替代
      • 对于单侧检验:找到α和n对应的值t(α)
      • 对应双侧检验:找到\frac{\alpha}{2}和n对应的值t(\frac{\alpha}{2})
    • F分布查表:根据α, n1, n2以及单双侧检验找到对应表,运用F_p(n,m) = \frac{1}{F(m,n)}

7.3 统计量和抽样分布定理

  • 统计量
    • 样本函数:样本 X_1, X_2,...,X_n的一个连续函数 g(X_1, X_2,...,X_n)
    • 统计量:不含任何参数的样本函数 g(X_1, X_2,...,X_n)
    • 统计量的观测值:入样本观测值后的样本函数g(x_1, x_2,...,x_n)
    • 常用统计量
    • 名称

      统计量

      观测值

      样本均值

      样本方差

      样本标准差

      样本k阶原点矩

      样本k阶中心距

  • 抽样分布定理
    • 抽样分布定理:常用统计量与样本函数的分布的结果
    • 一个正态总体下的抽样分布定理:样本X_1, X_2,...,X_n来自正态总体N(µ, \sigma^2),则

    • 两个正态总体下的抽样分布定理:若两个总体 X ∼ N(\mu_1, \sigma_1^2),Y ∼ N(\mu_2, \sigma_2^2),

ps:关于样本方差除以(n-1)的原因:

在实际生活中,如果如果总体均数已知,求样本方差的时候是除以n的

但事实上,我们往往很难获知一个总体的总体均数,而是从总体中我们可以进行无数次抽样,每次抽样便获得一个特定的样本,然后计算出特定的样本均数和样本标准差。所以,只要抽样一次,样本值就可能变化一次。因此,样本值是变化的。用一个变化的量去估计一个恒定的量,首要原则就是“无偏”。然而,在计算样本方差时,若采用总体方差的计算方法(除以n),则由下列计算过程可得,样本方差E(S^2)是总体方差\sigma^2的渐进无偏估计量,而不是无偏估计量

根据计算得到的总体方差与样本方差的关系,我们得到了样本方差与总体方差之间的定量关系,即

\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}=\frac{n-1}{n} \sum_{i=1}^{n}\left(X_{i}-\mu\right)^2

对样本方差的计算进行调整,便可得到

\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(X_{i}-\mu\right)^{2}

综上,在计算样本方差时,我们需要用下式

以上参考了两篇知乎的文章:

【1】样本方差为什么除以n-1(关于自由度的疑问)?

【2】为什么样本方差(sample variance)的分母是 n-1?

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值