数理统计期末复习笔记（二）

ldc1513

于 2022-12-22 11:05:24 发布

阅读量585

点赞数

分类专栏：图书阅读课程复习资料文章标签：概率论统计

本文链接：https://blog.csdn.net/ldc1513/article/details/128406038

版权

本文是数理统计的期末复习笔记，重点涵盖了贝叶斯方法、统计决策、偏差分析和线性回归。介绍了贝叶斯估计、决策规则、ANOVA分析和线性回归模型，包括简单和多元线性回归的细节，如残差分析和模型检验。

摘要由CSDN通过智能技术生成

主要内容：
贝叶斯估计，统计决策，偏差分析，线性回归

贝叶斯派的观点认为，概率就是信念
贝叶斯推断： $\theta$ ：作为随机变量， $X_1,...,X_n\sim p(x|\theta)$ ，后验 $\sim$ 先验*似然，即 $p(\theta|x_1,...,x_n)\sim p(\theta)\times p(x_1,...,x_n|\theta)$

对 $\theta$ 的贝叶斯估计： $\hat{\theta}=E(\theta|x)$
先验的构造：
- 平坦先验：均匀分布，密度函数为常数；但是对于数据变换并不是不变的
- Jeffery先验：先验对于fisher信息变换必须不变，即 $\pi_J(\theta)=(det(I_n(\theta)))^{1/2}$ ，这里I_n是用样本的似然 $p(x|\theta)$ 求的；但是只有一维的时候比较高效
- Reference先验：希望从先验中汲取到的信息最少： $p(\theta)=\operatorname{argmax}_\theta d_{KL}(p(\theta),p(\theta|x))$ , $d_{\mathrm{KL}}(P \| Q)=\int_{-\infty}^{\infty} p(x) \ln \frac{p(x)}{q(x)} \mathrm{d} x$ ；在一维下，Jeffery先验和reference先验相等
- conjugate先验：选择先验使得和后验的分布一样；即寻找共轭组 $F$ 使得先验和后验均在其中
贝叶斯置信区间：

$P(\theta\in [L(U),C(U)]|X)=1-\alpha$
贝叶斯检验：

贝叶斯检验同样建立在后验上。在检验中，比较 $P(\theta\in\Theta_0|x)$ 和 $P(\theta\in\Theta_1|x)$ ，哪个大就推断 $\theta$ 满足哪个。（设定域的自由度降低了不少）

决策规则： $X$ 为分布 $P$ 中随机产生的若干样本根据 $X$ 来决定若干行动，称为决策： $D:(X,F_X)\rightarrow (A,F_A)$ , $F$ ： $\sigma$ -域

决策的估值：loss function $L(\theta,a)$ ：在情况 $\theta$ 下选择行动a的代价

eg：平方损失函数，p-范数，0-1损失函数等
有些决策具有随机性，需要引入风险函数： $R(\theta,a)=E_\theta L(\theta,a)$ （这里是指对 $p(X|\theta)$ 求期望，因为 $a$ 是根据 $X$ 决定的）

对于决策规则 $A, B$ ，如果对任意 $\theta$ ，A的选择的风险都不比B大，则称A至少和B一样好（互相=>等价）

对于一族决策规则 $\mathcal{T}$ ，决策规则 $T^*$ 称为 $\mathcal{T}$ -最优的，如果它和任何其他决策都至少一样好

对于一组决策规则 $\mathcal{T}$ ，决策规则 $T$ 称为 $\mathcal{T}$ -可采纳的（admissible），如果没有决策和它至少一样好
Rao-blackwell定理：对于一个非随机策略 $T_0$ 和凸的损失函数，考虑 $H$ 为一个充分统计量，那么 $T_1=E(T_0(x)|H)$ 一定至少和它一样好；因此只需要考虑仅和充分统计量有关的规则即可

最大最小风险

最大最小估计： $R_n\triangleq \inf_{\hat{\theta}\in T} \sup_{\theta}R(\theta,\hat{\theta})$

即：在一族规则中，选择最大风险最小的那个
贝叶斯风险

考虑先验 $\pi$ 下贝叶斯风险为： $B_\pi (\hat{\theta})=\int R(\theta,\hat{\theta})\pi(\theta)d\theta$ ，故贝叶斯估计： $\inf_{\hat{\theta}\in T} B_\pi(\hat{\theta})$

贝叶斯检验的性质： $\pi$ 为先验=>后验分布： $\pi(\theta|x)\sim p(x|\theta)\pi(\theta)$

后验风险：考虑 $r(\hat{\theta}|x)=\int L(\theta,\hat{\theta})\pi(\theta|x)d\theta$

定理： $\hat{\theta}(x)=\operatorname{argmin}_\theta r(\hat{\theta}|x)$

示例： $L=(\theta-\hat{\theta})^2$ ： $\hat{\theta}$ = $\pi(\theta|x)$ 的期望； $L=|\theta-\hat{\theta}|$ ：中位数； $L = 0 - 1$ ：单峰
关联：拥有常数的风险函数的贝叶斯估计必然是最大最小估计

应用：证明某个策略是最大最小估计：构造恰当的先验给出一个常数风险的贝叶斯估计

注：最大似然估计MLE 渐近地是最大最小估计