问卷调查设计以及敏感性问题调查

1 问卷调查的目的?

首先来看看问卷调查的定义,引自维基百科:

问卷调查是对目标对象的意见调查的其中一个方法,问卷调查的形式是由一连串写好的小问题组成,然后去访问,收集被访问者的意见、感受、反应及对知识的认识等

其实做问卷调查大概率是进行抽样调查,抽样即从总体中抽取出样本,根据样本性质估计总体。

2 问卷调查的设计

对于问卷调查的设计,我们首先来看一个有意思的案例:
在这里插入图片描述
基于上述的一个调查结果后,可口可乐公司决定上新产品!使用新可乐代替传统可乐!但是一上线接到大量投诉!!!

这是为什么呢?

我们来看看上面可口可乐设计的问题:“如果在可口可乐配方中增加一种新的成分,使它喝起来更柔和,您愿意吗?”

典型的具有诱导性!!!这么问,肯定大家都会想要试一试啊!所以本质是问卷调查的设计有问题!

类似诱导性的问题有:你有多喜欢这个产品?

但如果提问改为:你如何评价这个产品? 这样会更合适一些!

3 什么叫敏感性问题调查?

在问卷调查中,有一类问题是属于敏感性问题调查,什么叫敏感性问题调查呢?比如:“你是否偷税漏税过?”“你是否考试的时候发生过作弊行为?”等等。那么这类问题如果直接在问卷调查中进行体现,肯定是不合适的,应该如何进行呢?具体有如下三种方式:迂回式提问,问题设置,随机化回答技术

4 敏感性问题调查的方式

4.1 方式1:迂回式提问

比如可以这么进行提问:

有些同学考试作弊,您认为他们最主要的原因是?

A. 为了考试及格或取得更好成绩

B. …

C. …

D. …

您同意上述看法吗?

A. 同意

B. 不同意

即“有些同学”“你的朋友”系列式提问!

4.2 方式2:问题设置

设计含义相反的问题,或者同一问题不同的写法,在问卷中不同位置出现,观察答案是否一致

  • 如果不一致,则可能这个问卷可信性就没有那么高!

  • 如果一致,可信性比较高!

4.3 方式3:随机化回答技术

这也是这篇推文想要重点去讲解的。即采用随机化回答技术(主要是全概率公式)来解决敏感性问题的调查。

随机化回答技术:指在调查中使用特定的随机装置, 使调查者以预定的概率回答问题。这一技术可以最大限度的保护被调查者的隐私, 从而取得被调查者的信任。

具体有两种模型:沃纳模型西蒙斯模型

这两个模型的思想都是:给出两个问题(答案均为“是”或者“否”),然后一开始设计一个随机的模式(比如盒子中放一个黑球,一个白球,用户去摸球,摸到黑球回答第一个问题,摸到白球回答第二个问题),保证用户的隐私,即别人不知道他究竟回答了哪个问题。然后基于一个样本人群的回答结果,使用全概率公式就是可以算出我们关心的概率问题的答案!

数据概况:

  • 假设有1000位用户参与测试
  • 回答“有”的用户是400位,“否”的用户是600位
  • 盒子中放一个黑球,一个白球,用户去摸球,摸到黑球回答问题1,摸到白球回答问题2

设回答“有”记为事件 B B B,回答问题1记为事件 A 1 A_1 A1,回答问题2记为事件 A 2 A_2 A2

4.3.1 沃纳模型

问题设置:两个问题都是敏感性问题,提问方式完全相反。

问题1:你是否发生有过考试作弊行为。

问题2:你是否从没有过考试作弊行为。

关心的问题:人群中发生过考试作弊行为的概率有多少?

根据全概率公式:

P ( B ) = P ( A 1 ) × P ( B ∣ A 1 ) + P ( A 2 ) × P ( B ∣ A 2 ) P(B)=P(A_1)×P(B|A_1) + P(A_2)×P(B|A_2) P(B)=P(A1)×P(BA1)+P(A2)×P(BA2)

关心的概率问题是:

P ( B ∣ A 1 ) = ? ? ? P(B|A_1)=??? P(BA1)=???

此时:

  • P ( B ) = 400 / 1000 = 0.4 P(B)=400/1000=0.4 P(B)=400/1000=0.4
  • P ( A 1 ) = 1 / 2 P(A_1)=1/2 P(A1)=1/2
  • P ( A 2 ) = 1 / 2 P(A_2)=1/2 P(A2)=1/2
  • P ( B ∣ A 1 ) = p P(B|A_1)=p P(BA1)=p ,故 P ( B ∣ A 2 ) = 1 − p P(B|A_2)=1-p P(BA2)=1p

代入后,会发现无法计算!因为涉及到 p p p的直接抵消掉了!所以沃纳模型有一个限定条件就是一开始的随机模式不能两个问题概率均为1/2!!!

所以接下来我们对随机模式进行更换:

数据概况:

  • 假设有1000位用户参与测试
  • 回答“有”的用户是400位,“否”的用户是600位
  • 盒子中放一个黑球,两个白球,用户去摸球,摸到黑球回答问题1,摸到白球回答问题2

此时:

  • P ( B ) = 400 / 1000 = 0.4 P(B)=400/1000=0.4 P(B)=400/1000=0.4
  • P ( A 1 ) = 1 / 3 P(A_1)=1/3 P(A1)=1/3
  • P ( A 2 ) = 2 / 3 P(A_2)=2/3 P(A2)=2/3
  • P ( B ∣ A 1 ) = p P(B|A_1)=p P(BA1)=p ,故 P ( B ∣ A 2 ) = 1 − p P(B|A_2)=1-p P(BA2)=1p

代入后计算得到 P ( B ∣ A 1 ) = p = 4 5 P(B|A_1)=p=\frac{4}{5} P(BA1)=p=54

即人群中发生过考试作弊行为的概率为 4 5 \frac{4}{5} 54,即通过这种随机化回答技术,在保证了客户隐私情况下得到了所需要的概率!

但是上面这个沃纳模型有一个小问题就是,两个问题都是敏感性问题!所以人们仍然可能会有一些戒备的心理。西蒙斯模型就可以解决这个问题!

4.3.2 西蒙斯模型

模型思想:向被调查者提出一个无关紧要的问题, 被调查者可能在感情上会觉得更安全, 因为作出回答并不能向调查人员泄漏更多的信息. 即在"匿名状态"的情况下, 使用两个互不相关的问题, 一个与敏感问题相关, 另一个是非敏感问题, 调查人员会得到更多的信任。

问题设置:一个问题是敏感性问题,另一个问题是已知概率的非敏感性问题

问题1:你是否发生有过考试作弊行为。

问题2:你的生日是在7月1日以前吗?

关心的问题:人群中发生过考试作弊行为的概率有多少?

P ( B ) = P ( A 1 ) × P ( B ∣ A 1 ) + P ( A 2 ) × P ( B ∣ A 2 ) P(B)=P(A_1)×P(B|A_1) + P(A_2)×P(B|A_2) P(B)=P(A1)×P(BA1)+P(A2)×P(BA2)

此时:

  • P ( B ) = 400 / 1000 = 0.4 P(B)=400/1000=0.4 P(B)=400/1000=0.4
  • P ( A 1 ) = 1 / 3 P(A_1)=1/3 P(A1)=1/3
  • P ( A 2 ) = 2 / 3 P(A_2)=2/3 P(A2)=2/3
  • P ( B ∣ A 1 ) = p P(B|A_1)=p P(BA1)=p ,故 P ( B ∣ A 2 ) = 1 / 2 P(B|A_2)=1/2 P(BA2)=1/2

代入后计算得到 P ( B ∣ A 1 ) = p = 1 5 P(B|A_1)=p=\frac{1}{5} P(BA1)=p=51

即人群中发生过考试作弊行为的概率为 1 5 \frac{1}{5} 51,即通过这种随机化回答技术,在保证了客户隐私情况下得到了所需要的概率!并且两个问题中加入了已知概率的非敏感性问题!放松了被调查者的警惕,也赢得了信任!估计结果也更加精准!

5 参考

  • https://zhuanlan.zhihu.com/p/135523164
  • https://zh.wikipedia.org/wiki/%E5%95%8F%E5%8D%B7%E8%AA%BF%E6%9F%A5
  • 4
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值