从贝叶斯角度理解正则化

最新推荐文章于 2024-03-23 20:15:53 发布

scyf340

最新推荐文章于 2024-03-23 20:15:53 发布

阅读量2.8k

点赞数 4

分类专栏：学习文章标签：贝叶斯正则化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sc2079/article/details/103148102

版权

文章目录

前言

上一篇：正则化

下一篇：提前终止法与正则化法关系

1.贝叶斯法则

贝叶斯法则： $\frac{P(B|A)P(A)}{P(B)}$

$P (A)$ 称为先验概率（反映在已知 $B$ 之前对事件 $A$ 的认知）； $P (A ∣ B)$ 称为后验概率（反映在已知 $B$ 之后对事件 $A$ 的认知）； $P (B ∣ A)$ 是在事件 $A$ 发生的条件下，事件 $B$ 发生的条件概率； $P (B)$ 是事件的边缘概率（被用作归一化因子）

贝叶斯法则在于先验概率，如果它很大，那么后验概率也将显著增大

2.正则化项

一个包括网络输入及其对应目标输出的训练样本集：

$\left\{ p_{1},t_{1} \right\},\left\{ p_{2},t_{2} \right\},\cdots,\left\{ p_{n},t_{n} \right\}$

假设目标输出通过如下方式生成：

$t_{q} = g(p_{q}) + \varepsilon_{q}$ （13.2）

其中， $g ()$ 为某未知函数， $\varepsilon_{q}$ 为一个随机独立分布的零均值噪声源。我们的训练目标是产生一个能够逼近函数 $g ()$ 并且忽略噪声影响的神经网络。

神经网络训练的标准性能指标是该网络在训练集上的误差平方和：

$E_{D} = \sum_{q = 1}^{Q}{(t_{q} - a_{q})^{T}}(t_{q} - a_{q})$

其中， $a_{q}$ 表示输入为时网络的输出。 $E_{D}$ 这里表示训练数据上的误差平方和。

修改式，添加一个包含逼近函数（我们的例子中为神经网络）导数的惩罚项（或说为正则化项），以平滑所得到的函数。在一定条件下，正则化项可以写成网络权值平方和的形式，如：

$\beta {E_D} + \alpha {E_w} = \beta \sum\limits_{q = 1}^Q { { {({t_q} - {a_q})}^T}({t_q} - {a_q})} + \alpha \sum\limits_{i = 1}^n {x_i^2}$

其中，比率 $\alpha/\beta$ 用于控制网络解的有效复杂度。比率越大，网络响应越平滑。

正则化项本质上是一种先验信息，整个最优化问题从贝叶斯观点来看是一种贝叶斯最大后验估计，其中正则化项对应后验估计中的先验信息，损失函数对应后验估计中的似然函数，两者的乘积即对应贝叶斯最大后验估计的形式，如果你将这个贝叶斯最大后验估计的形式取对数，即进行极大似然估计，你就会发现问题立马变成了损失函数+正则化项的最优化问题形式。

3.贝叶斯正则化

David Mackey将神经网络的训练置于贝叶斯框架中，除了选取正则化参数外，它还对训练过程的很多方面有所帮助。

该贝叶斯分析有两层：

对正则化性能指标进行统计学推导，理解参数的意义；
第二层：估计参数。

第 $I$ 层贝叶斯框架

该贝叶斯框架假设神经网络的权值为随机变量。对于给定的数据集，我们选取能够最大化权值的条件概率的权值。贝叶斯法则用于计算如下概率函数：

$P(x|D,\alpha,\beta,M) = \frac{P(D|x,\beta,M)P(x|\alpha,M)}{P(D|\alpha,\beta,M)}$

其中， $x$ 是包含网络所有权值和偏置量； $D$ 表示训练数据集； $\alpha$

最低0.47元/天解锁文章

关注

4
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
从贝叶斯角度理解正则化

文章目录前言1.贝叶斯法则2.正则化项3.贝叶斯正则化第III层贝叶斯框架第II\text{II}II层贝叶斯框架贝叶斯正则化算法步骤参考资料参考资料前言上一篇：正则化下一篇：贝叶斯正则化与提前终止法关系1.贝叶斯法则贝叶斯法则： P(A∣B)=P(B∣A)P(A)P(B)P(A|B) = \frac{P(B|A)P(A)}{P(B)}P(A∣B)=P(B)P(B∣A)P(A)P...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。