优化概率神经网络_Bayesian Neural Networks：贝叶斯神经网络

最新推荐文章于 2024-06-20 09:44:45 发布

weixin_39884872

最新推荐文章于 2024-06-20 09:44:45 发布

阅读量1.1k

点赞数 1

文章标签：优化概率神经网络

贝叶斯神经网络，简单来说可以理解为通过为神经网络的权重引入不确定性进行正则化（regularization），也相当于集成（ensemble）某权重分布上的无穷多组神经网络进行预测。

本文主要基于 Charles et al. 2015^[1]。

FBI WARNING：本文讨论的是 贝叶斯神经网络，而非 贝叶斯网络。 FBI WARNING：鉴于近期知乎上一些睿智发言，本文将所有术语翻译成了中文，请谨慎食用。

题图来源

0. 神经网络的概率模型

众所周知，一个神经网络模型可以视为一个条件分布模型

：输入

，输出预测值

的分布，

为神经网络中的权重。在分类问题中这个分布对应各类的概率，在回归问题中一般认为是（标准差固定的）高斯（Gaussian）分布并取均值作为预测结果。相应地，神经网络的学习可以视作是一个最大似然估计（Maximum Likelihood Estimation, MLE）：

其中

对应我们用来训练的数据集（dataset）。回归问题中我们代入高斯分布就可以得到平均平方误差（Mean Squared Error, MSE），分类问题则代入逻辑函数（logistic）可以推出交叉熵（cross-entropy）。求神经网络的极小值点一般使用梯度下降，基于反向传播（back-propagation， BP）实现。

MLE 中不对

的先验概率作假设，也就是认为

取什么值的机会都均等。如果为

引入先验，那就变成了最大后验估计（Maximum Posteriori, MAP）：

代入高斯分布可以推出 L2 正则化（倾向于取小值），代入拉普拉斯分布（Laplace）可以推出 L1 正则化（倾向于取 0 使权重稀疏）。

1. 贝叶斯起来了！

贝叶斯估计（bayesian estimation）同样引入先验假设&

最低0.47元/天解锁文章

weixin_39884872

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
优化概率神经网络_Bayesian Neural Networks：贝叶斯神经网络

贝叶斯神经网络，简单来说可以理解为通过为神经网络的权重引入不确定性进行正则化（regularization），也相当于集成（ensemble）某权重分布上的无穷多组神经网络进行预测。本文主要基于 Charles et al. 2015[1]。FBI WARNING：本文讨论的是贝叶斯神经网络，而非贝叶斯网络。FBI WARNING：鉴于近期知乎上一些睿智发言，本文将所有术语翻译成了中文，请谨慎食用...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。