全概率公式:敏感问题的调查

    1965年Stanley L.Warner发明了一种能消除人们抵触情绪的“随机化应答”方法。
该方案的核心是如下两个问题:
    问题A:你的生日是否在7月1日之前(一般来说,生日在7月1日以前的概率为0.5)?
    问题B:你所问的涉及到被调查人敏感信息的问题,比如用在Coursera开概率课程的台湾大学葉丙成老师的例子:有柯南在一定会死人么?或者是你看过不健康书刊么?
   被调查者事先从一个装有黑球和白球的箱子中随机抽取一个球,看过颜色后又放回。若抽出白球则回答问题A;若抽出黑球则回答问题B。箱中黑球所占比率α是已知的,即
   P{任意抽取一个是黑球}=α
   P{任意抽取一个是白球}=1-α
   当然也可以用别的方法决定回答哪个问题,比如说扔骰子,抛硬币。只要是我们事先知道出现这种结果的概率即可。
   被调查者无论回答A题或B,都只需在一张只有“是”和“否”两个选项的答卷上作出选择,然后投入密封的投票箱内。
   上述抽球和答卷都在一间无人的房间内进行,任何人都不知道被调查者抽到什么颜色的球以及在答卷中如何选择,这样就不会泄露个人秘密,从而保证了答卷的真实可靠性。
   当有较多的人(譬如1000人)参加调查后,打开投票箱进行统计。设共有n张有效答卷,其中k张选择“是”,则可用频率k/n 估计选择答案 ‘是’ 的概率ϕ,记为:ϕ=P(答“是”)=k/n。
   回答“是”有两种情况:
   一种是摸到白球对问题A回答“是”,也就是被调查者“生日”在7月1日之前”的概率,一般认为是0.5,即P(答‘是’|抽白球)=0.5。
   另一种是摸到黑球后对问题B回答“是”,这个条件概率就是看不健康书刊的学生在参加调查的学生中的比率p,即p=P(答‘是’|抽黑球),这是我们最关心的。
   利用全概率公式:
   P(答‘是’)=P(抽黑球)*P(答‘是’|抽黑球)+P(抽白球)*P(答‘是’|抽白球)
   ϕ=α*P+(1-α)*0.5=k/n
   P=(k/n-(1-α)/2)/α
   假设箱子中共有50个球,其中30个黑球,则α=0.6。如在一项调查大学生看过不健康书刊的调查时共有全校1583名学生参加,最后统计答卷,全部有效。其中回答“是”的有389张,据此可估算出: P=(389/1583-(1-0.6)/2)/0.6=0.0762
   这表明全校1583名学生中约有7.62%的学生看过不健康的书刊。
  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值