点估计和区间估计——统计学概念

最新推荐文章于 2025-03-21 21:54:34 发布

德瑞-Derry

最新推荐文章于 2025-03-21 21:54:34 发布

阅读量8.1k

点赞数 2

分类专栏：基础统计概念文章标签：统计学 python

本文链接：https://blog.csdn.net/yanlei_open/article/details/113089932

版权

基础统计概念专栏收录该内容

1 篇文章

订阅专栏

本文介绍了统计学中点估计和区间估计的基本概念，点估计利用样本均值估计总体参数，可能存在误差；而区间估计提供参数可能范围，增强了推断的准确性。通过实例和Python代码展示如何计算置信区间，强调了样本量、抽样方法和置信度的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

概念简介：

点估计和区间估计是通过样本统计量估计总体参数的两种方法。点估计是在抽样推断中不考虑抽样误差，直接以抽样指标代替全体指标的一种推断方法。因为个别样本的抽样指标不等于全体指标，所以，用抽样指标直接代替全体指标，不可避免的会有误差。区间估计是抽样推断中根据抽样指标和抽样误差去估计全体指标的可能范围的一种推断方法。在从抽样指标推断全体指标时，用一定概率保证误差不超出某一给定范围。

点估计：

点估计是使用抽样数据得到总体有样本参数。比如，针对某市房租平均价格的统计，全部统计成本会比较大，因此我们随机选择某一部分的在租房屋进行统计，计算均值用来表示某市房租价格的整体均值。但是点估计和抽样的样本量强相关，样本量占总体越少越可能会出现误差。比如，随机抽样中存在较多的极值，导致我们点估计的结果偏高。或者样本不够随机，选择市中心的房租对某市的房租估计显然也是不准确的。

区间估计：

区间估计估计不同于点估计，能够提供待估计参数的置信区间和置信度（即保证XX%的可能性该参数的值位于*~*之间，例如，有95%的可能性全市房租均价在2000~2500之间），区间估计虽然不能得出精确的估计值，但是能够提供保证程度，代表了有多大把握总体参数会在相应的置信区间内。在对全体样本进行多次抽样，根据中心极限定理，多次抽样的样本均值会服从均值为总体样本均值的正态分布。

其中，μ为均值，σ为标准差，由于总体的均值μ和总体的μ是未知参数，因此我们使用抽样样本的均值和标准差作为总体均值和标准差的估计值。

因此可以根据正态分布的图像可知，

μ±σ时，概率为68.26%；

μ±2σ时，概率为95.44%；

μ±3σ时，概率为99.74%。

在统计学中，常用的置信度一般取95%和99%，因此更为精确的值参考下图。

附区间估计的python代码实现：

# 代码来源网路，使用时将house_price换成自己的Dataframe，price换成要估计的参数即可
se = house_price.price.std() / len(house_price_gr) ** 0.5 #均值标准误差
LB = house_price.price.mean() - 1.96 * se #置信区间下界
UB = house_price.price.mean() + 1.96 * se #置信区间上界