在机器学习的学习和理解过程中,需要学习者具备概率论的知识。在此记录下经常遇到的概率知识。
1,全概率公式
在概率计算中,求取较复杂、情况较多的事件概率时,有时候可以曲线救国,从已知的、简单的事件的概率来求得最终结果。而这些简单的事件相等于对复杂事件的整体样本空间做了划分。
我们先来说样本空间的划分。
假设
Ω
是随机试验
E
的样本空间,而
B1∪B2∪B3∪⋯∪Bn=Ω
则 B1,B2,B3,⋯Bn 称为 Ω 的一个有限划分。
Ω 的划分不是唯一的,依据不同的准则,会产生不同的空间划分。但是一旦划分确定,那么做一次试验 E ,事件
然后我们看如何基于样本空寂的划分得到全概率公式:
假设随机试验 E 的样本空间为
这就是 全概率公式。根据条件概率的定义,我们可以进一步得到:
P(A)=∑i=1nP(A|Bi)P(Bi)=∑i=1nP(ABi)
所以我们可以得到全概率公式传达的意义。它实际上是借助于样本空间的划分对事件 A 进行了划分。借助于样本空间
全概率公式在ML中的体现 举例:
在强化学习中,当MDP模型已知且需要进行有模型学习时,由于状态转移概率和奖赏函数已知,可通过全概率公式展开,得到值函数的递归形式,进而可采用动态规划进行策略评估和策略迭代改进。