【最新数理统计复习笔记】

我是小白熊

已于 2022-06-09 21:51:52 修改

阅读量246

点赞数

文章标签：概率论机器学习人工智能

于 2022-06-09 21:49:57 首次发布

本文链接：https://blog.csdn.net/weixin_41923539/article/details/125211344

版权

第一章概率论基础

在这里插入图片描述

第二章统计基础

常用抽样分布: $\chi^2, T, F$
1. $\chi^2_{1-\alpha} = -\chi^2_{\alpha}, T_{1=\alpha} = -T_{\alpha}$
2. $\displaystyle F_{1-\alpha}(n, m) = {1 \over F_{\alpha}(n, m)} = F_{\alpha}(m, n)$
正态总体的抽样分布
1. $\displaystyle \overline X \thicksim N(\mu, {\sigma^2 \over n})$
2. $\displaystyle {\overline X - \mu \over S/\sqrt{n}} \thicksim t(n-1)$
3. $\displaystyle {(n-1)S^2 \over \sigma^2} \thicksim \chi^2(n-1)$
次序统计量
1. 单个
2. 多个
充分统计量（利用因子分解定理求） $\theta) = g(t, \theta) h(x)$ 参考知乎讲解
1. 求联合密度函数
2. 因子分解：
  1. 与 $x$ 和 $\theta$ 都有有关的放第一项
  2. 只与 $x$ 有关的放第二项
  3. 第一项里找出只与 $x$ 有关部分为 $T$

第三章点估计及其优良性

点估计
- 矩估计 —— $E(X^i) = \sum X_j^i$
- 极大似然估计
  1. 求似然函数 $L(\theta) = \prod p(x_i; \theta)$ —— 目标最大化似然函数
  2. 求 $L(\theta)$
  3. 求导为 $\to$ 解得 $\theta$
- 极大似然估计特殊情况 $\theta 的取值范围与 X 有关$
  1. $\theta < X \to \theta < X_{(0)}$
点估计优良性
1. 无偏性： $E(\hat \theta) = \theta$
2. 有效性：（判断估计是否有效）判断 $Var(\theta) ?= CR下界$
  1. 计算方差 $Var(\hat \theta)$
  2. 计算 $C - R$ 下界 $\displaystyle{1 \over n I(\theta)}$
    1. 费希尔信息量: $I(\theta) = E[ d (ln p(X; \theta) / d\theta)^2]$
    2. 或者 $\displaystyle I(\theta) = - E[{d^2 ln p(X; \theta) \over d\theta^2}]$
  3. 判断 $Var(\hat \theta) = 1 / n I(\theta)$

第五章区间估计与假设检验

枢轴变量法区间估计
1. 先求出 $\theta$ 的点估计 $\hat \theta$
2. 通过 $\hat \theta$ 构造枢轴函数 $G(\hat \theta, \theta)$
  - $G$ 中除了 $\theta$ 外不含其他未知参数
3. $G(\hat \theta, \theta) < b) >= 1-\alpha$
  - $a, b$ 可通过查表获得
假设检验
1. 提出假设 $H_0, H_1$
  - 通常假设 $H_0$ 为总体参数 $\theta = xxx$
2. 确定检验统计量
3. 通过拒绝域判断原假设是否成立

第六章回归分析

$SS_T = SS_R + SS_E$
1. 离差平方和 $SS_T = \sum y_i^2 - n(\overline y)^2 = l_{yy}$
2. 回归平方和 $SS_R = \sum (\hat y_i - \overline y)^2 = \hat \beta_1^2 l_{xx}$
3. 残差平方和 $SS_E = \sum (y_i - \hat y_i)^2 = SS_T - SS_R$
简单线性回归（最小二乘法, 极大似然估计） $\beta_0 + \beta_1x + \sigma$
- $\hat \beta_0 = \overline y - \hat \beta_1 \overline x$
- $\hat \beta_1 = l_{xy}/l_{xx}$
  1. $l_{xy} = \sum x_i^2 - n \overline x \overline y$
  2. $l_{xx} = \sum x_i^2 - n(\overline x)^2$
- $\displaystyle \hat \sigma = {SSE \over n-2}$
参数的估计，$\beta_0, \beta_1 $的置信区间和假设检验
1. $\displaystyle \hat \beta_1 \thicksim N(\beta_1, {\sigma^2 \over l_{xx}})$
2. $\displaystyle \hat \beta_0\thicksim N(\beta_0, ({1 \over n} + { {\overline x}^2 \over l_{xx}})\sigma^2)$
3. $\displaystyle {(n-2){\hat \sigma}^2 \over \sigma^2} = {SSe \over \sigma^2 } \thicksim X^2(n-2)$
4. $\displaystyle \beta_1=0时, {SSr \over \sigma^2} = {\beta_1^2l_{xx} \over \sigma^2} \thicksim X^2(1)$
5. $\displaystyle {SS_R/(1) \over SS_E/(n-2)} \thicksim F(1, n-2)$
回归方程的显著性检验～检验 $\beta_1$ 是否为0
1. $H_0: \beta_1=0, H_1: \beta_1 != 0$
2. $\displaystyle {SS_e \over \sigma^2} = {(n-2)\hat \sigma^2 \over \sigma^2} \thicksim \chi^2(n-2)$
3. $\displaystyle {SS_r \over \sigma^2} \thicksim \chi^2(1)$
$F$ 检验
1. 提出 $H_0: \beta_1=0, H_1: \beta_1 != 0$
2. 检验统计量 $\displaystyle F = {SS_r / 1 \over SS_e / (n-2)} \thicksim F(1, n-2)$
3. 代入数据求$ F$，查表求 $F_\alpha(1, n-2)$
4. 比较大小，若 $F$ 大则拒绝 $H_0$ , 效果显著
$T$ 检验
点预测和区间预测
1. 点预测直接带入 $\hat y_0 = \hat \beta_0 + \hat \beta_1 x_0$
2. 区间预测 : 直接用 $y_0 \thicksim N(\hat y_0, \hat\sigma^2)$
3. $y_0 \to \hat y_0 \pm z_{\alpha/a} \hat\sigma$
控制
样本相关系数 $\displaystyle r_{xy} = {l_{xy} \over \sqrt{l_{xx}l_{xy}}}$
$Cov(\hat\beta_0, \hat\beta_1) = Cov(\bar y - \hat\beta_1 \bar x, \hat\beta_1) = -\bar x Var(\hat\beta_1)$
注：
1. 区间预测
  1. $y_0 \thicksim N(\beta_0+\beta_1x_0, \sigma^2)$
  2. $\displaystyle \hat y_0 \thicksim N(\beta_0+\beta_1x_0, ({1 \over n}+{(x_0-\bar x)^2 \over l_{xx}})\sigma^2$
  3. $\displaystyle y_0-\hat y_0 \thicksim N(0, (1 + {1 \over n}+{(x_0-\bar x)^2 \over l_{xx}})\sigma^2)$
  4. $\displaystyle {(n-2) \hat \sigma^2 \over \sigma^2} = {SS_E \over \sigma^2} \thicksim \chi^2(n-2)$