参数估计（点估计和区间估计）-CSDN博客

本文链接：https://blog.csdn.net/weixin_43992800/article/details/100576931

参数估计包括点估计和区间估计。点估计使用样本统计量来估计总体参数，如用样本均值估计总体均值。区间估计提供一个包含总体参数的置信区间，如95%置信水平下的平均身高区间。置信区间计算涉及样本均值、标准误差、置信水平和分布，如Z分布、T分布和卡方分布。点估计适用于定性研究，而区间估计能提供估计精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

“参数估计是以抽样分布为中介，用样本的参数特征对总体的参数进行数值估计的过程。”

一、点估计
1.点估计就是用样本统计量来估计总体参数。
概念理解：当我们想知道某一总体的某个指标的情况时，测量整体该指标的数值的工作量太大，或者不符合实际，这时我们可以采用抽样的方法选取一部分样本测量出他们数值，然后用样本统计量的值来估计总体的情况。
例如：想了解一个学校学生的身高情况，就可以随机抽取一部分学生测量他们的身高，得到一个平均值，再用这个样本的均值去估计整体学生的身高情况，就是点估计。

常用的点估计有：用样本均值估计总体均值，用样本方差估计总体方差，用样本的分位数估计总体分位数，用样本的中位数估计总体的中位数。

2.点估计方法
矩估计法、顺序统计量法、最大似然法、
最小二乘法（对于点估计方法，放在另一篇文章中详细介绍）

3.由于用样本推断总体的过程一定存在估计误差，而点估计的估计误差无法衡量，所以点估计主要用于为定性研究提供数据参考，或者在对于总体参数估计精度要求不高时使用。

二、区间估计
1.区间估计就是在点估计的基础上，给出总体参数估计的一个区间范围，该区间通常由样本统计量加减估计误差得到。
另外一种说法，区间估计是从点估计值和抽样标准误差出发，按给定的概率值建立包含待估参数的区间，这个给定的概率值称为置信度或置信水平，这个建立起来的包含待估计参数的区间称为置信区间。

2.关于置信水平（置信度）、置信区间和显著性水平：
置信区间是根据样本信息推导出来的可能包含总体参数的数值区间，置信水平表示置信区间的可信度；例如某学校学生的平均身高的区间估计：有95%的置信水平可以认为该校学生的平均身高为1.4米到1.5米之间，（1.4,1.5）为置信区间，95%是置信水平，即有95%的信心认为这个区间包含该校学生的平均身高。
置信水平用百分数表示，表示成（1-a）100%；a指的是显著性水平，表示总体参数不落在置信区间的可能性。

3.关于置信区间的计算：
通过部分样本来计算总体参数的一个置信区间有以下步骤：
a.明确要解决的问题，要估计的指标或参数是什么，
b.求抽样样本的平均值和标准误差，
注意区分标准差和标准误差:标准差反映的是整个样本对样本平均数的离散程度，标准差等于方差开根号；标准误差反映的是样本平均数对总体平均数的变异程度，标准误差等于样本标准差除n的开根号。
c.确定需要的置信水平，
d.查询z表，得到z值，
e. 计算置信区间，[a,b],a=样本均值-z标准误差，b=样本均值+z标准误差。

区间估计分为一个总体参数的估计和两个总体参数的估计

4.一个总体参数的区间估计：总体均值的区间估计，总体方差的区间估计，总体比例的区间估计；

4.1总体均值的区间估计：
均值抽样分布即样本均值组成的抽样分布，总体参数的估计方法跟样本均值的抽样分布有关；
Z分布其实就是标准正态分布，如果样本均值组成的抽样分布服从正态分布，那么将该正态分布标准化后即可得到Z分布，
Z分布的适用条件有两种：一是总体服从正态分布且总体标准差已知；二是总体分布未知，但是样本容量大于或等于30；
T分布：对于服从正态分布的总体且总体标准差未知的情况下，T分布是非常适用的均值抽样分布类型；
切比雪夫不等式：对于非正态分布总体或总体分布未知并且小样本的情况下，只能用切比雪夫不等式来近似估计总体均值的置信区间。
在这里插入图片描述截图来自《人人都会数据分析：从生活实例学统计》

4.2 总体方差的区间估计：
总体方差的区间估计要用到卡方分布，如果数据总体服从正态分布，从中抽取样本容量为n的样本，样本方差为s^2,那么包含样本方差的卡方统计量服从自由度为n-1的卡方分布。卡方统计量是由总体方差和样本方差的比值组成的统计量，用于总体方差的区间估计。
卡方统计量的计算公式：
$\chi^2_\alpha(n-1)=\frac{(n-1)s ^2}{\sigma ^2_z}$
总体方差的双侧置信区间估计公式为：
$\frac{(n-1)s^2}{\chi ^2_\frac{\alpha}{2}(n-1)} \leq \sigma ^2_z \leq \frac{(n-1)s ^2}{\chi ^2_1-\frac{\alpha}{2} (n-1)}$
其中带有a/2的为下标；
如果是单侧置信区间的话，只需要取上面式子的前半部分或者后半部分，并将a/2改成a即可得到单侧置信区间。

4.3 总体比例的区间估计：
或者叫总体比率的区间估计，跟二项分布有关，二项分布的理论是：事件发生概率是p,进行n次实验，其中x次实验该事件发生，则发生次数的概率分布服从二项分布；均值、方差为np,npq。
若将发生的次数转换成比率（x/n），则比率的概率分布也服从二项分布。
二项分布的特性：当抽取的样本容量n很大，是大样本，使得np和nq（q为事件不发生的概率，等于1-p）的值都大于 5，此时二项分布将近似于正态分布。
由于事件发生比率x/n服从二项分布，所以如果比率的二项分布近似于正态分布，就可以得到不利的区间估计。

在事件发生概率p已知的情况下，总体比率