怎样用非数学语言讲解贝叶斯定理(Bayes theorem)?
一机器在良好状态生产合格产品几率是90%,在故障状态生产合格产品几率是30%,机器良好的概率是75%,若一日第一件产品是合格品,那么此日机器良好的概率是多少?
这是贝叶斯定理的一个典型应用。如何在逻辑上进行推理,而不套用公式得到答案呢?这是我们今天的工作。
1 三个要素
概率的问题其实只要把握好概率空间的三要素样本:空间、事件、概率就可以了。
那这三要素是什么意思呢?这里简单做个介绍。
还是经典的掷硬币。
样本空间就是事件条件下所得到的所有结果,因此掷一次硬币的样本空间为{正面,反面}。
而概率空间中的事件与我们平时生活中所说的事件没有任何分别。这里指的是此掷一次硬币。
概率,就是事件发生后,出现结果的个数与样本空间个数的比值。
假如此次为掷硬币的结果为正面,因为正面这个结果只发生了一次,而样本空间的个数是2,所以掷一次硬币出现正面的概率就为1/2.
2 题目中的三要素
知道了概率空间的结构,我们来找找开篇题目中的三要素。
若一日第一件产品是合格品,那么此日机器良好的概率是多少?
这句话告诉我们,在产品是合格品的范围内,找到机器良好的发生概率。
可见所有的合格品是样本空间。而机器良好是事件。
2.1 一个小tips
因为在概率论的题目中,经常出现不同样本空间下的概率数字,这样有时会产生困惑。因此,建议初学者使用一个基础数据,统一量纲。
这里的题目对象是产品,据此假设有1000件产品。开始我们的计算。
2.2 样本空间
我们把题目的信息都给加上去。首先我们的对象是产品。(后面没有标注单位的默认为件)
机器良好的概率是75%, 则故障的概率为25%
良好状态生产合格产品几率是90%。
在故障状态生产合格产品几率是30%
需要注意的是,这里90% 所对应的样本空间为良好状态。30% 所对应的样本空间为故障状态。
放到同一张图中
因为最后要找的样本空间为所有的合格品,因此去掉对我们没有意义的机器是否正常的划分。
整个样本空间的大小为缩小为750件合格产品。
而机器正常时,生产出正常产品为675件.
因此答案就是 事件大小/样本大小 = 675/750=90%
3 贝叶斯定理
3.1 条件概率
条件概率指在A事件发生的情况下,B事件发生的概率。
“A事件发生的情况下”,代表A为样本空间,“B事件发生的概率”,代表
A
∩
B
A\cap B
A∩B 为事件。
因此
P
(
B
∣
A
)
=
P
(
A
∩
B
)
P
(
A
)
P(B|A)=\frac{P(A\cap B)}{P(A)}
P(B∣A)=P(A)P(A∩B)
做一下公式变形
P
(
A
∩
B
)
=
P
(
B
∣
A
)
P
(
A
)
P(A\cap B)=P(B|A)P(A)
P(A∩B)=P(B∣A)P(A)
3.2 贝叶斯定理
文章开头说了,这是一个贝叶斯定理的典型应用。
那贝叶斯定理到底是什么呢?
可见
P
(
D
)
=
P
(
D
∩
A
)
+
P
(
D
∩
B
)
+
P
(
D
∩
C
)
P(D)=P(D\cap A) + P(D\cap B) + P(D\cap C)
P(D)=P(D∩A)+P(D∩B)+P(D∩C)
由条件概率的公式也可以写成
P
(
D
)
=
P
(
D
∣
A
)
P
(
A
)
+
P
(
D
∣
B
)
P
(
B
)
+
P
(
D
∣
C
)
P
(
C
)
P(D)=P(D|A)P(A) + P(D|B)P(B) + P(D|C)P(C)
P(D)=P(D∣A)P(A)+P(D∣B)P(B)+P(D∣C)P(C)
算出来的结果就是事件D在样本空间S下发生的概率。
先发生A再发生D的事件
计算事件在样本空间下的概率
那么M发生在A中的概率
P
(
A
∣
D
)
=
P
(
A
∩
D
)
P
(
D
)
P(A|D)=\frac{P(A\cap D)}{P(D)}
P(A∣D)=P(D)P(A∩D)
=
P
(
D
∣
A
)
P
(
A
)
P
(
D
∣
A
)
P
(
A
)
+
P
(
D
∣
B
)
P
(
B
)
+
P
(
D
∣
C
)
P
(
C
)
=\frac{P(D|A)P(A)}{P(D|A)P(A) + P(D|B)P(B) + P(D|C)P(C)}
=P(D∣A)P(A)+P(D∣B)P(B)+P(D∣C)P(C)P(D∣A)P(A)
这就是贝叶斯公式!
.
.