对于贝叶斯理论来说,我们的核心目标是确定p(θ|X),即模型参数θ对于样本X的后验分布。

本文介绍了贝叶斯模型在推断中的应用,强调了确定后验概率分布的重要性。在高维数据情况下,通过朴素贝叶斯方法简化计算,假设特征独立来估算样本概率。此外,还探讨了使用MCMC方法规避复杂的后验概率积分计算,通过蒙特卡洛采样得到近似结果。这些方法在统计推断和机器学习中有广泛应用。
摘要由CSDN通过智能技术生成

1、确定这个后验概率分布有什么用?

在使用贝叶斯模型进行推断的时候,我们是基于已有样本X(下边的公式中用D表示了,意义都一样),和新样本x*,给出该样本的类别估计(比如给出x*属于垃圾邮件的概率,等等)。那么这个类别估计等于什么呢?如下述公式所示:要考虑所有的模型参数θ(所以对θ进行了积分),对于每个θ,给出基于样本X的后验概率,最后基于该模型参数θ和样本x*,给出贝叶斯模型的推断结果,属于y^hat的概率。

简单来说,使用贝叶斯模型进行推断的时候,考虑了所有的模型参数;每个模型参数的概率,基于样本的后验概率【p(θ|X)】得到;最后,基于模型参数θ和给定样本x*得到推断结果。

2、如何计算这样的后验分布呢?

2.1、 西瓜书中那种做法:要计算P(+|x)过渡到统计正样本的概率P(+)和P(x|+)【正样本中x出现的可能性】。由于x的维度非常高,P(x|+)基本趋近于0(可以这样理解,我手上的样本根本就没有见过x)。那怎么办嘛。来一个假设,假设样本的各个维度是独立,P(x|+)≈P(x_d1|+)P(x_d2|+)...P(x_dn|+)。P(x_d1|+)对于正样本来说是好统计的,以此类推。新来一个样本x,我们就能基于手上的样本,给出一个它属于正样本的概率了。 属于什么方法呢?

西瓜书中提到,计算P(+|x)【x属于正样本的概率】通过贝叶斯定理可以转换为计算P(x|+)【正样本中,x出现的概率】这样的条件概率太难计算了,所以为了绕开这个麻烦,遂提出了上述↑的方法。叫做朴素贝叶斯方法;

2.2、MCMC跟p(θ|X)有何关系?

在这篇博客中“https://www.cnblogs.com/little-YTMM/p/5399532.html”,说白了,使用模型进行推断时,就是要计算下式的复杂积分。所以,也是直接跳过计算p(θ|X),而是直接通过MCMC的方法,给出采样结果x。

蒙特卡洛方法解决的问题是:

1、推荐看刘建平的博客:https://www.cnblogs.com/pinard/p/6638955.html

2、蒙特卡罗方法最早都是为了求解一些不太好求解的积分问题

3、根据博客https://www.cnblogs.com/little-YTMM/p/5399532.html,这个复杂积分可以通过下述方法进行估计:

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值