统计学-点估计和区间估计

点估计和区间估计

点估计


矩估计法

正态分布是一种统计量,目的是描述总体的某一性质。而则是描述这些样本值的分布情况,无论几阶矩,无外乎是描述整体的疏密情况。K阶矩分为原点矩和中心矩:

前者是绝对的:1阶就是平均值;2阶则是平方的平均值;3阶是立方的平均值,如此类推。

后者是相对于平均值而言:1阶即期望;2阶即方差的估计;如此类推。
原点矩

μ k ′ = E ( Y k ) {μ}'_{k}=E(Y^k) μk=E(Yk)  (k=1,2,…)

中心矩

μ k = E [ ( Y − μ ) k ] μ_k=E[(Y-μ)^k] μk=E[(Yμ)k]

k表示阶数


原点矩方法

对于总体:原点矩- E ( Y k ) E(Y^k) E(Yk)

对于样本: m k = ∑ i = 1 n y i k n m_k=\frac{\sum_{i=1}^{n}y_{i}^{k}}{n} mk=ni=1nyik

Y:观测值

举例:

y 1 , y 2 , y 3 , . . . y n y_1,y_2,y_3,...y_n y1,y2,y3,...yn代表一个随机样本的n个观测值,随机变量Y代表总体的分布,随机变量Y中有 θ 1 , θ 2 , θ 3 , . . . θ k θ_1,θ_2,θ_3,...θ_k θ1,θ2,θ3,...θkk个参数,矩估计需要估计出k个参数 θ ^ 1 , θ ^ 2 , θ ^ 3 , . . . θ ^ k \hat{θ}_1,\hat{θ}_2,\hat{θ}_3,...\hat{θ}_k θ^1,θ^2,θ^3,...θ^k


θ ^ \hat{θ} θ^: E ( Y ) = 1 n ∑ y i E(Y)=\frac{1}{n}\sum y_i E(Y)=n1yi

θ ^ 2 \hat{θ}_2 θ^2: E ( Y 2 ) = 1 n ∑ y i 2 E(Y^2)=\frac{1}{n}\sum {y_i}^2 E(Y2)=n1yi2

一个参数使用一个方程,若K个参数则使用K个方程。求总体的平均值只有一个参数,使用一个方程就可。

假设:总体的期望为μ
则有E(Y)=μ

假设只有一个参数

此时使用矩估计的方法,只有一个参数,即使用一个方程:

Y的一阶原点矩 μ 1 ′ = E ( Y 1 ) {μ}'_{1}=E(Y^1) μ1=E(Y1)既他的期望本身 μ 1 ′ = E ( Y 1 ) {μ}'_{1}=E(Y^1) μ1=E(Y1)

样本的一阶原点矩,既样本求和: μ = 1 n ∑ y i μ=\frac{1}{n}\sum y_i μ=n1yi

这时发现公式似乎很眼熟:
x ˉ = 1 n ∑ y i \bar{x}=\frac{1}{n}\sum y_i xˉ=n1yi
平均值不就是这么来的么。

当有两个参数时呢

可以设置第二个参数 E ( Y 2 ) = 1 n ∑ y i 2 E(Y^2)=\frac{1}{n}\sum {y_i}^2 E(Y2)=n1yi2

然后结合第一个式子用两个方程求解。


中心矩方法

其他参考上文

对于样本公式: ∑ ( y i − y ˉ ) k n \frac{\sum (y_i-\bar{y})^k}{n} n(yiyˉ)k

其他方法


最大似然法/极大似然法,最小二乘法,刀切法,稳健估计,Bayes方法

区间估计


区间估计是一个区间,区间分别由Lower和Upper构成–>(Lower,Upper)称为置信区间,其中包含着被估计参数的概率称为置信水平/置信系数[概率]
如置信水平为95%,那么这个区间也叫95%置信区间。

虚轴法

假设有一个估计量 θ ^ \hat{θ} θ^ E ( θ ^ ) E(\hat{θ}) E(θ^)=θ,即 θ ^ \hat{θ} θ^的期望=θ,θ为要估计的参数。
Z = θ ^ − θ σ θ ^ Z=\frac{\hat{θ}-θ}{\sigma _{\hat{θ}}} Z=σθ^θ^θ

假设Z符合正态分布,整个正态分布图的面积为1,
阴影部分的面积为0.05,非阴影部分的面积则为1-0.05=0.95

可以将面接还原成概率,整体的概率为100%,那么Z落在非阴影区域的概率便为95%。
Z–>( − Z α / 2 -Z_{\alpha/2} Zα/2, Z α / 2 Z_{\alpha/2} Zα/2)即( − Z α / 2 -Z_{\alpha/2} Zα/2≤Z≤ Z α / 2 Z_{\alpha/2} Zα/2)

在分布中,阴影部分的面积为α,空白区域即为1-α,分布的两翼阴影面积各为α/2,所以有Z=1-α:可推出如下公式。

LCL= θ ^ − z α 2 σ θ ^ \hat{θ}-z\frac{\alpha}{2}\sigma _{\hat{θ}} θ^z2ασθ^  UCL= θ ^ + z α 2 σ θ ^ \hat{θ}+z\frac{\alpha}{2}\sigma _{\hat{θ}} θ^+z2ασθ^

所以确定了如下步骤:

  • 确定统计量θ
  • 确定概率分布(利用概率密度函数)
  • 求置信区间

同理,如果是卡方分布,t分布也可以依照相同的理论求值。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值