贝叶斯网络代码实现_贝叶斯神经网络BNN(推导+代码实现)

最新推荐文章于 2024-05-21 02:49:11 发布

weixin_39602108

最新推荐文章于 2024-05-21 02:49:11 发布

阅读量5.3k

点赞数 5

文章标签：贝叶斯网络代码实现

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39602108/article/details/113327144

版权

1. 简介

贝叶斯神经网络不同于一般的神经网络，其权重参数是随机变量，而非确定的值。如下图所示：

也就是说，和传统的神经网络用交叉熵，mse等损失函数去拟合标签值相反，贝叶斯神经网络拟合后验分布。

这样做的好处，就是降低过拟合。

2. BNN模型

BNN 不同于 DNN，可以对预测分布进行学习，不仅可以给出预测值，而且可以给出预测的不确定性。这对于很多问题来说非常关键，比如：机器学习中著名的 Exploration & Exploitation （EE）的问题，在强化学习问题中，agent 是需要利用现有知识来做决策还是尝试一些未知的东西；实验设计问题中，用贝叶斯优化来调超参数，选择下一个点是根据当前模型的最优值还是利用探索一些不确定性较高的空间。比如：异常样本检测，对抗样本检测等任务，由于 BNN 具有不确定性量化能力，所以具有非常强的鲁棒性。

概率建模:

在这里，选择似然分布的共轭分布，这样后验可以分析计算。比如，beta分布的先验和伯努利分布的似然，会得到服从beta分布的后验。

由于共轭分布，需要对先验分布进行约束。因此，我们尝试使用采用和变分推断来近似后验分布。

神经网络： 使用全连接网络来拟合数据，相当于使用多个全连接网络。但是神经网络容易过拟合，泛化性差；并且对预测的结果无法给出置信度。

BNN: 把概率建模和神经网络结合起来，并能够给出预测结果的置信度。

先验用来描述关键参数，并作为神经网络的输入。神经网络的输出用来描述特定的概率分布的似然。通过采样或者变分推断来计算后验分布。同时，和神经网络不同，权重 W 不再是一个确定的值，而是一个概率分布。

BNN建模如下：

假设 NN 的网络参数为

equation?tex=W

，

equation?tex=p%28W%29

是参数的先验分布，给定观测数据

equation?tex=D%3D%7BX%2CY%7D

，这里

equation?tex=X

是输入数据，

equation?tex=Y

是标签数据。BNN 希望给出以下的分布：

也就是我们预测值为：

equation?tex=P%5Cleft%28Y%5E%7B%5Cstar%7D+%7C+X%5E%7B%5Cstar%7D%2C+D%5Cright%29%3D%5Cint+P%5Cleft%28Y%5E%7B%5Cstar%7D+%7C+X%5E%7B%5Cstar%7D%2C+W%5Cright%29+P%28W+%7C+D%29+d+W+%EF%BC%881%EF%BC%89+%5C%5C

由于，

equation?tex=W

是随机变量，因此，我们的预测值也是个随机变量。

其中：

$equation?tex=P%28W+%7C+D%29%3D%5Cfrac%7BP%28W%29+P%28D+%7C+W%29%7D%7BP%28D%29%7D+%EF%BC%882%EF%BC%89+%5C%5C$

这里

equation?tex=P%28W%7CD%29

是后验分布，

equation?tex=P%28D%7CW%29

是似然函数，

equation?tex=P%28D%29

是边缘似然。

从公式（1）中可以看出，用 BNN 对数据进行概率建模并预测的核心在于做高效近似后验推断，而变分推断 VI 或者采样是一个非常合适的方法。

如果采样的话：我们通过采样后验分布

equation?tex=P%28W+%5Cvert+%5Cmathcal%7BD%7D%29

来评估

equation?tex=P%28W+%5Cvert+%5Cmathcal%7BD%7D%29

, 每个样本计算

最低0.47元/天解锁文章

weixin_39602108

关注

5
点赞
踩
40

收藏

觉得还不错? 一键收藏
0
评论
贝叶斯网络代码实现_贝叶斯神经网络BNN(推导+代码实现)

1. 简介贝叶斯神经网络不同于一般的神经网络，其权重参数是随机变量，而非确定的值。如下图所示：也就是说，和传统的神经网络用交叉熵，mse等损失函数去拟合标签值相反，贝叶斯神经网络拟合后验分布。这样做的好处，就是降低过拟合。2. BNN模型BNN 不同于 DNN，可以对预测分布进行学习，不仅可以给出预测值，而且可以给出预测的不确定性。这对于很多问题来说非常关键，比如：机器学习中著名的 Explora...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。