1. 数理统计学框架
关键词:定义 框架
1.1 定义
对某一个待研究问题进行建模(模型+误差),将问题转化为参数估计或假设检验问题。
(Remarks:
在我看到的文献中,生物统计应用文献确实遵循如此规则,在研究时也应如此。)
1.2 框架
- 总体
- 样本
- 统计量
在统计量用作不同目的时,可根据其名字判断其用途:
描述统计学中用描述性统计量 –> 描述数据;
估计理论中用估计量 –> 参数估计;
统计假设检验中用检验统计量 –> 假设检验;
往往一个统计量会有多种用途,如常见的样本均值,样本方差,etc.
2. 常用估计方法介绍
常用的估计方法包括:矩估计法,极大似然估计法,贝叶斯估计法等;
2.1 矩估计法
(以原点矩为例):
αm≡E[Xm]=∫∞−∞xmf(x;θ)dx≈am=∑i=1nXmi/n
Remarks:
- 用原点矩 αk 或者中心距 μk 均可;
- 参数不管一维还是 k 维,求解是平凡的,为解方程/方程组;
- 若是带估计量为参数
θ 的函数,记为 g(θ) ,那么 g^=g(θ) ;(值得注意的是新参数的标准误 se(g^)≠g(se(θ^)) ,一般用 δ -法等来估计) - 一般来说,能用低阶矩就不用高阶矩;
- 当总体分布的参数表达未知时,仍可以直接估计那些能用矩表达的量,如均值( α1 或 μ ),方差( μ2 或 σ2 ),变异系数( σ/μ ),偏度( β1=μ3/μ3/22 ),峰度( β2=μ4/μ22 );
- 以上2-3条对MLE仍然适用。
2.2 极大似然估计法
θ^MLE=argmaxθL(X1,...,Xn;θ);
当分布函数连续时可以化为求解似然方程组:
∂lnL∂θi=0;(i=1,...,k).
Remarks:
- 似然函数是充分统计量;
- MLE有时很难求解,也可能不止一组解;
- 一般来说,MLE给出的估计更为优良;
2.3 贝叶斯估计法
估计方法Steps | 函数表达 |
---|---|
参数 θ 的先验p.d.f | h(θ) |
随机变量
X
关于 | f(X;θ) |
(X1,X2,...,Xn,θ) 的联合p.d.f | h(X˜,θ)=h(θ)f(X1;θ)...f(Xn;θ) |
(X1,X2,...,Xn) 的边缘p.d.f | p(X1,...,Xn)=∫h(X˜,θ)dθ |
θ 的后验p.d.f | h(θ|X˜)=h(X˜,θ)/p(X1,...,Xn) |
Remarks:
- 在得到 θ 的后验分布后,对参数的任何统计推断都只基于这个后验分布;(如求后验分布的期望得到参数点估计)
- 先验密度 h(θ) 不一定需要是严格的密度函数,只需要满足: h(θ)≥0 和边缘密度有限即可,此时称为“广义先验密度”;
- 贝叶斯方法计算量是非常大的;
3. 估计量优良性准则
- 小样本性质
- 无偏性
- 最小方差无偏估计(MVUE:Minimum Variance Unbiased Estimator)
- 充分性
- 大样本性质
- 相合性
- 渐近有效性
3.1 小样本性质
无偏性: 定义偏差(Bias) B(θ^)=E(θ^−θ) ;若 B(θ^)≡0 ,则称 θ^ 为 θ 的一个无偏估计;
最小方差无偏估计: 定义均方误差 MSE(θ^)=E(θ^−θ)2 ,则称使得均方误差取得最小值的那个估计为MVUE.
- MSE(θ^)=Var(θ^)+[B(θ^)]2 ;其中 Var(θ^) 刻画估计量 θ^ 的随机误差,而 B(θ^) 刻画其系统误差;
- 要使MSE达到最小,当且仅当 Var(θ^) 达到最小(i.e.最小方差)且偏差 B(θ^)=0 ,i.e. 无偏;
- 此时显然 Var(θ^)=MSE(θ^),se(θ^)=MSE(θ^−−−−−−−√) ;
- 可以利用Fisher信息量用于构造Cramer-Rao’s lower bound;
Cramer-Rao 不等式 对 g(θ) 的任一无偏估计 g^=g(X1,...,Xn) ,有
Varθ(g^)≥(g′(θ))2/(nI(θ))
其中
I(θ)=∫[(∂f(x;θ)∂θ)2/f(x;θ)]dx .
- 充分性: (这里我直接用构造定理来解释,而非定义)
构造定理 记样本 X˜ 的p.d.f.为 f(x˜|θ) ,那么统计量 T(X˜) 是充分统计量iff
对所有的 x˜ 、 θ ,存在函数 g(t|θ) 和 h(x˜) ,s.t.
f(x˜|θ)=g(T(x˜)|θ)h(x˜).
Remarks:
1. 对充分性的理解不深,之后可以重开一张来仔细review;
3.2 大样本性质[@casella2002statistical]
- 相合性:
T(X˜)
是
g(θ)
的一个估计量,若对
∀ϵ>0
,
limn→∞P(|T(X˜)−g(θ)|≥ϵ)=0,
且对 θ 的一切可能取值都成立,则称 T(X˜) 是 g(θ) 的一个相合估计.
- 相合估计是对一个估计量的最基本的要求;
- 极大似然估计在很一般的条件下也有相合性,证明请查阅三明治法;
- 渐近有效性: 若
T(X˜)
是渐近正态的,即依分布收敛于
n−−√[T(X˜)−g(θ)]→N(0,v(θ))
, 并且渐近方差
v(θ))
达到Cramer-Rao 下界。
- 极大似然估计在正则性条件下是渐近有效的;
4. 区间估计
详见”Interval_Estimation.Rmd”;