点估计和区间估计——统计学概念

概念简介:

 

        点估计和区间估计是通过样本统计量估计总体参数的两种方法。点估计是在抽样推断中不考虑抽样误差,直接以抽样指标代替全体指标的一种推断方法。因为个别样本的抽样指标不等于全体指标,所以,用抽样指标直接代替全体指标,不可避免的会有误差。区间估计是抽样推断中根据抽样指标和抽样误差去估计全体指标的可能范围的一种推断方法。在从抽样指标推断全体指标时,用一定概率保证误差不超出某一给定范围。

点估计:

        点估计是使用抽样数据得到总体有样本参数。比如,针对某市房租平均价格的统计,全部统计成本会比较大,因此我们随机选择某一部分的在租房屋进行统计,计算均值用来表示某市房租价格的整体均值。但是点估计和抽样的样本量强相关,样本量占总体越少越可能会出现误差。比如,随机抽样中存在较多的极值,导致我们点估计的结果偏高。或者样本不够随机,选择市中心的房租对某市的房租估计显然也是不准确的。

区间估计:

        区间估计估计不同于点估计,能够提供待估计参数的置信区间和置信度(即保证XX%的可能性该参数的值位于*~*之间,例如,有95%的可能性全市房租均价在2000~2500之间),区间估计虽然不能得出精确的估计值,但是能够提供保证程度,代表了有多大把握总体参数会在相应的置信区间内。在对全体样本进行多次抽样,根据中心极限定理,多次抽样的样本均值会服从均值为总体样本均值的正态分布。     

  

其中,μ为均值,σ为标准差,由于总体的均值μ和总体的μ是未知参数,因此我们使用抽样样本的均值和标准差作为总体均值和标准差的估计值。

因此可以根据正态分布的图像可知,

μ±σ时,概率为68.26%;

μ±2σ时,概率为95.44%;

μ±3σ时,概率为99.74%。

在统计学中,常用的置信度一般取95%和99%,因此更为精确的值参考下图。

附区间估计的python代码实现:

# 代码来源网路,使用时将house_price换成自己的Dataframe,price换成要估计的参数即可
se = house_price.price.std() / len(house_price_gr) ** 0.5 #均值标准误差
LB = house_price.price.mean() - 1.96 * se #置信区间下界
UB = house_price.price.mean() + 1.96 * se #置信区间上界

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值