全概率公式:敏感问题的调查


西祠胡同的创始响马大叔搞了个轻社区孢子,口号是一起玩,不孤单,某天心血来潮想在上面搞个统计调查,稍微涉及到隐私信息,孢子不支持匿名回答,只好借助下面的手段来获得这些敏感性的信息。涉及到的知识很简单,就是全概率公式。 

1965年Stanley L.Warner发明了一种能消除人们抵触情绪的“随机化应答”方法。

该方案的核心是如下两个问题: 

问题A:你的生日是否在7月1日之前(一般来说,生日在7月1日以前的概率为0.5)?

问题B:你所问的涉及到被调查人敏感信息的问题,比如用在Coursera开概率课程的台湾大学葉丙成老师的例子:有柯南在一定会死人么?或者是你看过不健康书刊么smiley

被调查者事先从一个装有黑球和白球的箱子中随机抽取一个球,看过颜色后又放回。

若抽出白球则回答问题A;若抽出黑球则回答问题B。箱中黑球所占比率α是已知的,即 
P{任意抽取一个是黑球}=α

P{任意抽取一个是白球}=1-α

当然也可以用别的方法决定回答哪个问题,比如说扔骰子,抛硬币。只要是我们事先知道出现这种结果的概率即可。

被调查者无论回答A题或B,都只需在一张只有“是”和“否”两个选项的答卷上作出选择,然后投入密封的投票箱内。

上述抽球和答卷都在一间无人的房间内进行,任何人都不知道被调查者抽到什么颜色的球以及在答卷中如何选择,这样就不会泄露个人秘密,从而保证了答卷的真实可靠性。 
当有较多的人(譬如1000人)参加调查后,打开投票箱进行统计。设共有n张有效答卷,其中k张选择“是”
,则可用频率k/n 估计选择答案 ‘是’ 的概率ϕ,记为:ϕ=P(答“是”)=k/n。

回答“是”有两种情况:一种是摸到白球对问题A回答“是”,也就是被调查者“生日
在7月1日之前”的概率,一般认为是0.5,即P(答‘是’|抽白球)=0.5。
另一种是摸到黑球后对问题B回答“是”,这个条件概率就是看不健康书刊的学生在参加调查的学生中的比率p,即,p=P(答‘是’|抽黑球),这是我们最关心的。 利用全概率公式:

P(答‘是’)=P(抽黑球)*P(答‘是’|抽黑球)+P(抽白球)*P(答‘是’|抽白球)

ϕ=α*P+(1-α)/2=k/n

P=(k/n-(1-α)/2)/α

假设箱子中共有50个球,其中30个黑球,则α=0.6。如在一项调查大学生看过不健康书刊的调查时共有全校1583名学生参加,最后统计答卷,全部有效。其中回答“是”的有389张,据此可估算出: 
P=(389/1583-(1-0.6)/2)/0.6=0.0762

这表明全校1583名学生中约有7.62%的学生看过不健康的书刊。

当然也可以这样算:

回答为‘是’的人数=回答问题A答案为‘是’的人数+回答问题B答案为‘是’的人数

回答问题B答案为‘是’的人数=回答答案为‘是’的人数-回答问题A答案为‘是’的人数

=389- 回答问题A的人数*回答问题A为是的概率

=389-1583*(1-0.6)*0.5=72.4,

即有72个人回答问题B的时候选择了答案‘是’。

概率P=72/回答问题B的人数=72.4/(1583*0.6)=0.0762.


参考:概率统计方法与应用。邓华玲

      ()[网络]

 


             

转自   http://www.zhenv5.com/?p=1082     

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值