总体占比的比较

选举中,我想知道男人和女人都给某些候选人的占比是否有显著不同?
男性中 投给某候选人的占比为p1,不投给这个候选人的占比为1-p1. 投给此候选人为1,不投给此候选人为0.
女性中 投给这个候选人的占比为p2,不投给这个候选人的占比为1-p2. 投给此候选人为1,不投给此候选人为0.

这两个都是伯努利分布。

男:均值=p1,方差=p1*(1-p1)

女:均值=p2,方差=p2*(1-p2)

所求:p1 和 p2 是否有显著差异?也就是 p1 - p2的分布。

我们希望求出一个95%的置信区间,为此我们调查了1000个男性 和 1000个女性投票者。

样本男:642投了此候选人,记为1 358未投此候选人,记为0. p1 = 0.642 方差=0.6420.358
样本女:591投了此候选人,记为1 409未投此候选人,记为0. p2 = 0.591 方差=0.591
0.409

由于样本容量大,所以随机抽样分布 接近 正太分布:

随机抽样均值分布男 总体均值=样本均值=0.642 总体方差=方差=0.6420.358/1000(大容量样本下 我们用样本方差估计总体方差)
随机抽样均值分布女 总体均值=样本均值=0.591 总体方差=方差=0.591
0.409/1000(大容量样本下 我们用样本方差估计总体方差)

随机抽样均值差分布 分布均值=0.642-0.591=0.051 方差=0.6420.358/1000 + 0.5910.409/1000=0.022X0.022
差值分布95%的置信区间 查表可知 z=1.96 d=1.96X0.022=0.043
所以 有95%机率均总体占比之差落在样本占比之差左右0.043范围内 即:p1-p2的95%置信区间是 0.008到0.094

假设检验:
零假设:投票男女占比无差别 即总体差值 p1-p2 = 0
备择假设:投票男女占比有差别 即总体差值 p1-p2 != 0
使用显著性水平5%进行检验

零假设下:总体差值分布的均值为0,样本差值=0.051,求出0.051距离0有几个标准差?

查Z表可知:正太分布下,2.5%的z值=1.96。如果0.051距离0的标准差数>1.96,说明样本概率小于5%,这样就可以拒绝零假设。

零假设下:p1=p2,方差有更好的估计值,即 方差=2p(1-p)/1000 p=(642+591)/2000 则标准差=0.0217
0.051/0.0217=2.35

                 2.35>1.96,所以我们拒绝零假设。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值