【深度学习系列】贝叶斯神经网络

最新推荐文章于 2024-02-28 18:01:29 发布

lrchang

最新推荐文章于 2024-02-28 18:01:29 发布

阅读量5.4k

点赞数 4

分类专栏：深度学习系列文章标签：深度学习神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42217215/article/details/124991040

版权

深度学习系列专栏收录该内容

2 篇文章 1 订阅

订阅专栏

没有免费的午餐定律
如果一个算法对某些问题有效，那么它一定在另外一些问题比纯随机搜索方法更差。

推荐学习贝叶斯神经网络资料：
[1] https://www.bilibili.com/video/BV1TL4y187qF?spm_id_from=333.337.search-card.all.click

[2] https://zhuanlan.zhihu.com/p/81170602

推荐的工具：
基于pytorch的Pyro以及基于tensorflow的Edward。

其他资源：
https://github.com/JavierAntoran/Bayesian-Neural-Networks

贝叶斯神经网络(BNN)的优缺点：

优点：鲁棒

缺点：耗时，收敛慢，很难计算不适用于参数非常多的深度神经网络。

贝叶斯神经网络与频率理论的区别

贝叶斯神经网络是对可信度的衡量，有先验概率，估计也是一个概率分布
然而概率理论要求对事件采样达到一个极限，没有先验概率，估计是一个数。例如抛硬币就是一个概率理论的代表。

在这里插入图片描述

如何设计贝叶斯神经网络
组成部分：一个神经网络+一个统计模型+先验概率和似然概率

统计模型的常见为概率图模型(PGM)，神经网络的边就是分布概率，
统计模型结合神经网络的结构：

变分推断算法在这里插入图片描述

神经网络模型
神经网络模型是一个条件分布模型 $P (y ∣ x, w)$ ，即输入样本 $x$ 预测 $y$ 的分布， $w$ 为神经网络的权重。神经网络的学习被视作一个最大似然估计(MLE)：
$w^{MLE} = \argmax log P(D|w)$
其中 $D$ 为训练数据集。最大似然估计的过程中，权重的取值是没有先验概率的。一旦权重取值引入先验概率，模型的预测就变成了一个最大后验概率(MAP)。

贝叶斯估计同样引用先验概率的假设，但是并不是求最大值，而是一个权重的后验概率 $P (w ∣ D)$ 。基于 $w$ 输入 $x$ 预测输出 $y$ 的概率模型为：
$P(y|x) = E_{P(w|D)}[P(y|x,w)]$

基于Pyro的BNN代码实现：

关注

4
点赞
踩
42

收藏

觉得还不错? 一键收藏
1
评论
【深度学习系列】贝叶斯神经网络

如果一个算法对某些问题有效，那么它一定在另外一些问题比纯随机搜索方法更差。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。