BNN方法总结

最新推荐文章于 2024-04-26 09:43:25 发布

LongTime.Li

最新推荐文章于 2024-04-26 09:43:25 发布

阅读量4k

点赞数

文章标签：神经网络深度学习机器学习

本文链接：https://blog.csdn.net/whereever123/article/details/122105994

版权

Bayesian Neural Networks(BNN)是衡量神经网络不确定性的一种方法，不同于确定性神经网络，BNN的权重是不确定的值，它的权重服从一定的先验，通过某种推断方法，计算出后验分布。

目前主流的BNN有两种主要方法，分别是采样MCMC和变分推断。

1.采样方法

采样方法主要是从利用采样的方法，对后验进行推断，即采样有限个点计算并取其平均值。

经典的方法如下：

HMC（Hamiltonian Monte-Carlo algorithm）
- 哈密顿蒙特卡洛采样
- 适用于小型网络，但是不适合深度学习中的大型模型
NUTS(No-U-Turn sampler)
- 对HMC算法的改进
- 自动调整算法超参数，不同手动设置
SGLD（stochastic gradient langevin dynamics）
- 将随机梯度郎之万动力学和MCMC算法结合起来
- 在培训期间使用小批量时，提供性能良好的马尔可夫链
- 缺点：关注单一模式的后验和样本变得越来越自相关
- 可以用于有大量数据集的