点估计和区间估计
点估计
矩估计法
正态分布是一种统计量,目的是描述总体的某一性质。而矩则是描述这些样本值的分布情况,无论几阶矩,无外乎是描述整体的疏密情况。K阶矩分为原点矩和中心矩:
前者是绝对的:1阶就是平均值;2阶则是平方的平均值;3阶是立方的平均值,如此类推。
后者是相对于平均值而言:1阶即期望;2阶即方差的估计;如此类推。
原点矩
μ k ′ = E ( Y k ) {μ}'_{k}=E(Y^k) μk′=E(Yk) (k=1,2,…)
中心矩
μ k = E [ ( Y − μ ) k ] μ_k=E[(Y-μ)^k] μk=E[(Y−μ)k]
k表示阶数
原点矩方法
对于总体:原点矩-
E
(
Y
k
)
E(Y^k)
E(Yk)
对于样本:
m
k
=
∑
i
=
1
n
y
i
k
n
m_k=\frac{\sum_{i=1}^{n}y_{i}^{k}}{n}
mk=n∑i=1nyik
Y:观测值
举例:
y 1 , y 2 , y 3 , . . . y n y_1,y_2,y_3,...y_n y1,y2,y3,...yn代表一个随机样本的n个观测值,随机变量Y代表总体的分布,随机变量Y中有 θ 1 , θ 2 , θ 3 , . . . θ k θ_1,θ_2,θ_3,...θ_k θ1,θ2,θ3,...θkk个参数,矩估计需要估计出k个参数 θ ^ 1 , θ ^ 2 , θ ^ 3 , . . . θ ^ k \hat{θ}_1,\hat{θ}_2,\hat{θ}_3,...\hat{θ}_k θ^1,θ^2,θ^3,...θ^k
θ ^ \hat{θ} θ^: E ( Y ) = 1 n ∑ y i E(Y)=\frac{1}{n}\sum y_i E(Y)=n1∑yi
θ ^ 2 \hat{θ}_2 θ^2: E ( Y 2 ) = 1 n ∑ y i 2 E(Y^2)=\frac{1}{n}\sum {y_i}^2 E(Y2)=n1∑yi2
一个参数使用一个方程,若K个参数则使用K个方程。求总体的平均值只有一个参数,使用一个方程就可。
假设:总体的期望为μ
则有E(Y)=μ
假设只有一个参数
此时使用矩估计的方法,只有一个参数,即使用一个方程:
Y的一阶原点矩 μ 1 ′ = E ( Y 1 ) {μ}'_{1}=E(Y^1) μ1′=E(Y1)既他的期望本身 μ 1 ′ = E ( Y 1 ) {μ}'_{1}=E(Y^1) μ1′=E(Y1)=μ
样本的一阶原点矩,既样本求和: μ = 1 n ∑ y i μ=\frac{1}{n}\sum y_i μ=n1∑yi这时发现公式似乎很眼熟:
x ˉ = 1 n ∑ y i \bar{x}=\frac{1}{n}\sum y_i xˉ=n1∑yi
平均值不就是这么来的么。
当有两个参数时呢
可以设置第二个参数 E ( Y 2 ) = 1 n ∑ y i 2 E(Y^2)=\frac{1}{n}\sum {y_i}^2 E(Y2)=n1∑yi2
然后结合第一个式子用两个方程求解。
中心矩方法
其他参考上文
对于样本公式:
∑
(
y
i
−
y
ˉ
)
k
n
\frac{\sum (y_i-\bar{y})^k}{n}
n∑(yi−yˉ)k
其他方法
最大似然法/极大似然法,最小二乘法,刀切法,稳健估计,Bayes方法
区间估计
区间估计是一个区间,区间分别由Lower和Upper构成–>(Lower,Upper)称为置信区间,其中包含着被估计参数的概率称为置信水平/置信系数[概率]
如置信水平为95%,那么这个区间也叫95%置信区间。
虚轴法
假设有一个估计量
θ
^
\hat{θ}
θ^,
E
(
θ
^
)
E(\hat{θ})
E(θ^)=θ,即
θ
^
\hat{θ}
θ^的期望=θ,θ为要估计的参数。
Z
=
θ
^
−
θ
σ
θ
^
Z=\frac{\hat{θ}-θ}{\sigma _{\hat{θ}}}
Z=σθ^θ^−θ
假设Z符合正态分布,整个正态分布图的面积为1,
阴影部分的面积为0.05,非阴影部分的面积则为1-0.05=0.95
可以将面接还原成概率,整体的概率为100%,那么Z落在非阴影区域的概率便为95%。
Z–>(
−
Z
α
/
2
-Z_{\alpha/2}
−Zα/2,
Z
α
/
2
Z_{\alpha/2}
Zα/2)即(
−
Z
α
/
2
-Z_{\alpha/2}
−Zα/2≤Z≤
Z
α
/
2
Z_{\alpha/2}
Zα/2)
在分布中,阴影部分的面积为α,空白区域即为1-α,分布的两翼阴影面积各为α/2,所以有Z=1-α:可推出如下公式。
LCL= θ ^ − z α 2 σ θ ^ \hat{θ}-z\frac{\alpha}{2}\sigma _{\hat{θ}} θ^−z2ασθ^ UCL= θ ^ + z α 2 σ θ ^ \hat{θ}+z\frac{\alpha}{2}\sigma _{\hat{θ}} θ^+z2ασθ^
所以确定了如下步骤:
- 确定统计量θ
- 确定概率分布(利用概率密度函数)
- 求置信区间
同理,如果是卡方分布,t分布也可以依照相同的理论求值。