近读列纳德·蒙洛迪诺的《醉汉的脚步》,读到第六章,作者举了一个超级变态的例子来解释条件概率或者说是贝叶斯概率。
1、先来看一个简单点的问题:已知所有有2个孩子的家庭,其中一个家庭2个孩子都是女孩的概率是多少?
这个超简单,样本空间为(BG,BB,GB,GG),如此,概率为1/4.
2、再看一个稍进一步的:已知有2个孩子的家庭,且已知一个家庭的一个孩子是女孩,那么这个家庭两个孩子都是女孩的概率是多少?
这个也不难,样本空间变小了(BG,GB,GG),如此,概率为1/3.
其实书中也说了条件概率最重要的一点就是:使样本空间变小,从而改变了概率。
3、再看终极变态的这个:如果我们知道有2个孩子的家庭里有1个女孩叫做Florida,那么这个家庭两个孩子都是女孩的概率是多少?
我相信绝大多数人和我一样,会认为和上一题的答案是一样的。因为一个女孩叫什么名字和这个概率没有任何关系。然而作者给出了不同答案:1/2.
为什么呢?百思不解。所以Google了一下,发现国内并没有人讨论过这个问题,但是国外这个问题比较火,很多论坛里都有讨论,下面给出我认为解释的最清楚的一种:
看这个图,因为Florida是一个极为稀少的名字,所以占人数的比例非常小,所以,还是那句老话:样本空间被变小了,上图下方和右方的狭长地带才是样本空间。所以本来(FF)只是占1/3,结果样本空间变小之后就变成了1/2了。
这个问题不能再进一步解释了,因为每个人都有自己的解释。如果有机会大家可以讨论一下哈。