置信区间 confidence interval

置信区间:

Find an interval such that “reasonbly confident” that were is a 95% chance that the true μ ( =P=μx¯ )

sampling distribution of the sample mean
μ :mean of the”sampling distribution of the sample mean”
σx¯ : variance of the “sampling distribution of the sample mean”
一般是有这个“sample mean”的distribution后,
就有了与标准正太分布做比较的依据。
z-score就是一种尺度,z-score= xμσx¯ ,
通过z表对应值即可找出置信区间。
例如,常说的,有95%的可能,population的均值出现在 μ±2σx¯ 中,

也就是z-score=2.0时,查标准正态分布表,值为0.9772,
于是置信区间为2*(0.9772-0.5)=0.9544,常约等于0.95

μ σx¯ ,则是通过做调查的样本估计得到的。

例如,某一地区投票选举,候选人为张三,李四。为了估计整个地区对二者的支持率为多少,我们随机抽取100人做调查,发现57人支持张三,43人支持李四。
为了让事件能够进行数学计算,我们把“支持张三”当做1,把“支持李四”当做0。
于是我们从这份样本中计算出均值 x¯=157+043100=0.43 ,方差 s2=57(10.43)2+43(00.43)21001=0.2475 s=0.5 ,因此,我们就用计算出来的s作为总体variance的估计, σ=s (约等于)
为什么用100-1

用100去除的话,得到的是biased estimate of population variance,就是有偏差的估计,经过大量模拟可以得出用n-1作为除数是偏差最小的估计,而如果用n-2的话,则估计值会偏大。或者用严谨的数学公式也能证明

于是,我们就能由我们选取的一个样本计算出的值来估计samping distribution of sample mean中的值,

μx¯=x¯

σx¯=σn

当然,这样的估计是有偏差的,而margin error= 2σx¯ ,即选取的样本越大,就是n越大,margin error越小。

我们可以得出 μx¯=x¯=0.43σx¯=σn=0.05marginerror=0.1

于是,最后我们得出结论,我们有95%的把握,该地区的所有人对张三的支持率为33%~53%( μx¯±2σx¯ )之间,而margin error为10%

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值