文章目录
0-主要内容
Point Estimation
Interval estimation
connection and difference
unbaised
有效性
相合性
1-什么是参数估计(Parameter estimation)?
点估计和区间估计,一个是用一个数值来估计未知参数,一个是使用一个区间来估计未知参数的可能取值范围。
为什么要在点估计的基础之上引入一个区间估计呢?
因为我们不仅希望有一个具体的值,还希望有一个估计的区间,区间有精度,可以避免非对即错带来的绝对性。
落在区间中有一个概率,更加的可靠。
2-点估计(Point estimation)
什么是点估计?
点估计:选择一个合适的统计量,利用样本的数据计算统计量的取值(一个点),以此作为未知参数的估计。
什么样的点估计好?(评价标准
对于点估计,我们有这么多的估计量,那么什么样的统计量是好的呢?
根据它与真实值的拟合程度,我们给出了几个判定标准。
1 无偏性,2 相合性(一致性),3 有效性。
-
无偏性是指参数的估计的期望等于真实参数值。即抽取样本计算得到的估计值不会偏离真实值太远。 E θ ^ = θ E\hat{\theta}=\theta Eθ^=θ
-
相合性是指被估统计量 θ ^ ( X 1 , X 2 , ⋯ , X n ) \hat{\theta}(X_1,X_2,\cdots,X_n) θ^(X1,X2,⋯,Xn)(是关于样本的随机变量)依概率收敛于真实的参数值 θ \theta θ。(一般只需要证明估计量的方差是n区域无穷大的无穷小)。以下是定义:
lim n → ∞ P ( ∣ θ ^ ( X 1 , X 2 , ⋯ , X n ) − θ ∣ ≤ ϵ ) = 1 \lim_{n \to \infty}P(|\hat{\theta}(X_1,X_2,\cdots,X_n)-\theta| \le \epsilon)=1 n→∞limP(∣θ^(X1,X2,⋯,Xn)−θ∣≤ϵ)=1 -
有效性,是对比两个无偏估计量得出来的一种关系。两个估计量都是未知参数的无偏估计,如果一个估计量 θ 1 \theta_1 θ1比另一个估计量 θ 2 \theta_2 θ2的方差小,则 θ 1 \theta_1 θ1比另一个 θ 2 \theta_2 θ2有效。
E ( θ 1 ^ ) = E ( θ 2 ^ ) , D ( θ 1 ^ ) < D ( θ 2 ^ ) \begin{aligned} E(\hat{\theta_1}) & = E(\hat{\theta_2}) ,\\ D(\hat{\theta_1}) & < D(\hat{\theta_2}) \end{aligned} E(θ1^)D(θ1^)=E(θ2^),<D(θ2^)
点估计方法
常见的有两种方法:矩估计和极大似然估计。
(好不想打公式的说)
矩估计
矩估计:利用样本矩来估计总体矩,原理是辛钦大数定律(当n足够大,可以利用样本矩来估计总体矩)。
极大似然估计
极大似然估计:在所有的可能参数中,找到是样本似然函数最大的一个参数值,将其作为未知参数的极大似然估计。一般使用单调性或者是数学上求极值的方法取得。
3-区间估计(Interval estimation)
为什么要引进区间估计?
害,还是那句话,原来的点估计不够,有更好。
非对即错,不喜欢,则加上精度,并且有概率保证程度,则就是估计区间。
对与区间估计,有双侧区间估计和单侧区间估计。
如果既需要关注估计量的上限,又关注下限的话,就使用双侧区间估计;如果只关心上限或者只关心下限的话,就使用单侧置信区间。
哦,提一句,在区间估计中,已知分布的那个量叫做枢轴量。
eg:当总体方差未知,求出总体均值的区间估计。
T
=
X
‾
−
μ
S
/
n
∼
t
(
n
−
1
)
T=\frac{\overline{X}-\mu}{S / \sqrt{n}} \thicksim t(n-1)
T=S/nX−μ∼t(n−1)
其中T就是一个枢轴量,分布已知,不是枢轴量,因为其中包含有未知参数 μ \mu μ.
什么是区间估计?
区间估计:选择一个合适的统计量,给定一个可以接受的置信度,利用统计量的分布计算出这个概率度为 1 − α 1 - \alpha 1−α的区间中。
当选择的枢轴量服从的分布为U分布或t分布时,总体均值置信区间的中心为总体均值的无偏估计。
常见的置信区间:
一个总体:
样本均值的置信区间。
三种情况:一是当样本方差已知时;二是当样本方差未知时;三是当总体分布未知但是是大样本时;分别都有相关的求法,其实他们主要是与枢轴量的分布有关。
样本方差的置信区间。当总体均值已知时,自由度为 n n n;当总体均值未知时,卡方分布为的自由度为 n − 1 n-1 n−1。
两个总体:
两个总体的均值差。当两个总体的均值已知时;当两个总体的均值未知,但是相等时;当两个总体的均值未知,且不相等时。
两个总体的方差的对比。当两个总体的均值已知时,当两个总体的均值未知时。均使用F分布。