比较如下几个问题,求出结果,并谈谈你的见解。
a) 李叔叔有两个孩子,两个孩子都是女孩的概率是多少?
b) 李叔叔有两个孩子,其中一个是女孩,两个孩子都是女孩的概率是多少?
c) 李叔叔有两个孩子,至少有一个孩子是在星期日出生的女孩,两个孩子都是女孩的概率是多少?
用 A i A_i Ai表示李叔叔的第 i i i个孩子, i = 1 , 2 i=1,2 i=1,2, A i = 1 A_i=1 Ai=1表示第 i i i个孩子是女孩, A i = 0 A_i=0 Ai=0表示第 i i i个孩子是男孩。假设每次生育得女孩和男孩的概率相等,即 P ( A i = 1 ) = 0.5 P(A_i=1)=0.5 P(Ai=1)=0.5,且两胎性别相互独立。
a) 李叔叔有两个孩子,两个孩子都是女孩的概率是多少?
两胎性别相互独立,因此
b) 李叔叔有两个孩子,其中一个是女孩,两个孩子都是女孩的概率是多少?
没有先验知识时:
已知其中一个是女孩,即
A
1
+
A
2
>
0
A_1+A_2>0
A1+A2>0,
c) 李叔叔有两个孩子,至少有一个孩子是在星期日出生的女孩,两个孩子都是女孩的概率是多少?
用
T
i
=
k
T_i=k
Ti=k表示第
i
i
i个孩子是星期
k
k
k出生的,
A
i
A_i
Ai与
T
i
T_i
Ti相互独立。则
因此:
从前面3题可以发现,已知信息量不同,两个孩子都是女孩的概率就不同。c题相比于b题提供了关于其中一个女孩更多的信息,如果把“在星期日出生”改为更一般的信息,用
D
i
D_i
Di来表示,且
D
i
D_i
Di与
A
i
A_i
Ai相互独立,
P
(
D
i
)
=
d
P(D_i)=d
P(Di)=d,那么可以仿照c题写出此时有两个女孩的概率:
可以看到,d越小(相当于其中一个女孩越特殊),两个孩子都是女孩的概率就越接近1/2,这是单独衡量另一个孩子是女孩的概率。d越大,两个孩子都是女孩的概率越接近1/3,这是b题的情况。而
D
i
D_i
Di只是一个一般的事件,它可以完全与“出生”这件事无关(例如“她买彩票中了500万”),而d的大小却能影响我对李叔叔两个孩子都是女孩的概率的判断,看起来令人难以接受。
或许可以这样理解:只知道“李叔叔有一个女儿”时,李叔叔孩子的性别组合及其概率为(年龄大的写在前,如“男女”表示兄妹):
当知道关于李叔叔一个女儿的某个信息D时,可以把满足D的情况记为“女1”,不满足的记为“女0”,得到性别组合及其概率为:
那么在“至少有一个孩子是满足D条件的女孩”的情况下,李叔叔有两个女儿的概率为:
当d特别小的时候,P(女1女1)<<P(女1女0)= P(女0女1),因此在上式中可以忽略。分子中橙色的部分与分母橙色的部分相比,刚好是0.5(相当于已知姐姐满足D条件,求另一个是妹妹的概率),而分子粉色的部分和分母粉色的部分相比也是0.5(相当于已知妹妹满足D条件,求另一个是姐姐的概率),所以此时总的P约等于0.5。在橙色和粉色的情况下,我们都能知道满足D条件的女孩具体是哪一个,所以此时判断“两个都是女孩”的概率和判断“另一个是女孩”的概率是同一回事;但P(女1女1)的情况却让我们分不清条件所指的“那个”女孩是姐姐还是妹妹,这种模糊性的影响随着d的增大而增大。