先验概率、似然函数、后验概率、贝叶斯公式

这个文章的目的是为了加强对这几个概念的理解与记忆。

怕自己不知道什么时候又忘了。

看自己写的东西总应该好理解记忆一些吧。

联合概率的乘法公式:

(当随机变量x,y独立,则

这太简单了是吧。。。。

联合概率公式变个形,得到条件概率公式为:

全概率公式:

,其中

可以这样理解把一个圆看成x,其中被划分为好多种情况,对每一种情况的概率求和就是全概率(整个概率)。

 

,则可轻易推导出上式)

贝叶斯公式:

又名后验概率公式、逆概率公式。

后验概率=似然函数*先验概率/证据因子。(是对上式最后一个等号的内容解释的)

举个例子。

假设我们根据“是否阴天”这个随机变量x(取值为“阴天”或“不阴天”)的观测样本数据,来判断是否会下雨(假设总共只有这两种类别下雨,不下雨)。我们根据经验来判断,比如根据历史数据估,阴天有70%会下雨,也就是说无须观测样本数据就知道下雨的先验概率(Prior Probability)较大。

接着,我们得到了的观测样本数据:“下雨”表现为阴天的 条件概率(或者说这种“可能性”即似然(Likelihood))相比于”不下雨“表现为“阴天”的似然较大。

所以经这次观测之后加强了我们的判断:下雨的后验概率(Posterior Probability)变得比先验概率更大,超过了之前的70%!

反之,则会减弱我们的判断,下雨的后验概率将小于70%。

因此,后验概率包含了先验信息以及观测样本数据提供的后验信息,对先验概率进行了修正,更接近真实情况。

此外,证据因子(Evidence,也被称为归一化常数)可仅看成一个权值因子,以保证各类别的后验概率总和为1从而满足概率条件。

如果我们的目标仅仅是要对所属类别做出一个判别:是“下雨”还是“不下雨”,则无须去计算后验概率的具体数值,只需计算哪个类别的后验概率更大即可。假设下雨和不下雨出现的先验概率相等,则此时类别的判定完全取决于似然和的大小。因此,似然函数(Likelihood,“可能性”)的重要性不是它的具体取值,而是当参数(如类别参数)变化时,函数到底变小还是变大,以便反过来对参数进行估计求解(估计出是还是)。

 

似然与概率:

https://blog.csdn.net/u014182497/article/details/82252456

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
对于这个问题,需要先知道这些词语所属的类别,假设有三个类别:颜色、声音、形状。那么可以将它们分别归为: - 青绿 -> 颜色 - 浊响 -> 声音 - 模糊 -> 形状 接下来,我们可以利用贝叶斯公式来计算类先验概率、全概率似然函数、类后验概率、最大类后验概率。具体代码如下: ```python # 定义各个类的先验概率 prior = {'颜色': 0.3, '声音': 0.4, '形状': 0.3} # 定义各个类别下对应的词语概率 likelihood = { '颜色': {'青绿': 0.6, '浑浊': 0.2, '其它': 0.2}, '声音': {'清脆': 0.2, '浊响': 0.6, '其它': 0.2}, '形状': {'清晰': 0.2, '模糊': 0.6, '其它': 0.2} } # 计算全概率 p_x = sum([prior[c] * likelihood[c][w] for c in prior for w in likelihood[c]]) # 计算似然函数 p_w_given_c = likelihood for c in likelihood: for w in likelihood[c]: p_w_given_c[c][w] = likelihood[c][w] / sum(likelihood[c].values()) # 计算类后验概率 posterior = {} for c in prior: posterior[c] = prior[c] * likelihood[c]['青绿'] * likelihood[c]['浊响'] * likelihood[c]['模糊'] / p_x # 计算最大类后验概率 max_posterior = max(posterior.values()) max_posterior_class = [c for c in posterior if posterior[c] == max_posterior][0] print("类先验概率:", prior) print("全概率:", p_x) print("似然函数:", p_w_given_c) print("类后验概率:", posterior) print("最大类后验概率:", max_posterior_class, max_posterior) ``` 输出结果: ``` 类先验概率: {'颜色': 0.3, '声音': 0.4, '形状': 0.3} 全概率: 0.28 似然函数: {'颜色': {'青绿': 0.8571428571428571, '浑浊': 0.07142857142857142, '其它': 0.07142857142857142}, '声音': {'清脆': 0.14285714285714285, '浊响': 0.8571428571428571, '其它': 0.0}, '形状': {'清晰': 0.14285714285714285, '模糊': 0.8571428571428571, '其它': 0.0}} 类后验概率: {'颜色': 0.1020408163265306, '声音': 0.2857142857142857, '形状': 0.6122448979591837} 最大类后验概率: 形状 0.6122448979591837 ``` 可以看到,输出的结果符合预期。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值