[深度学习-2.4] Dropout正则化

最新推荐文章于 2024-04-24 12:05:29 发布

Lucky_Go

最新推荐文章于 2024-04-24 12:05:29 发布

阅读量555

点赞数 1

分类专栏：深度学习入门文章标签： Dropout正则化深度神经网络

本文链接：https://blog.csdn.net/Lucky_Go/article/details/95229825

版权

深度学习入门专栏收录该内容

8 篇文章 0 订阅

订阅专栏

除了L2正则化之外，还有一个很常用的正则化技巧就是Dropout(随机失活)。它的主要思想就是随机丢弃网络每一层的一些神经元。

原理和实现

首先从原理上来理解一下什么是Dropout正则化。如下图所示(图片来源于吴恩达老师深度学习课程课件)，左图为一个正常的网络，进行Dropout正则化就是对于每一层的单元，根据一定的概率来“删除”掉他们，如下面右图所示，以0.5的保留概率(keep-prob)进行Dropout之后，剩下的神经元组成了一个比较简单的网络。

实现Dropout的方法很多，最常用的是inverted dropout。以一个深层神经网络的某一个隐藏层为例来解释怎么进行Dropout正则化。首先假设对于第 $l$ 层，其激活函数值为 $a^{[l]}$ ,我们设置的保留概率 $keep\_prob=0.8$ ，这意味着隐藏层的每一个神经元被以0.8的概率得到保留。
可以将inverted dropout方法归纳为四步：

根据 $keep\_prob$ 生成和 $a^{[l]}$ 同形的随机概率矩阵 $d^{[l]}$ , Dl = np.random.rand(Al.shape[0], Al.shape[1])
将 $d^{[l]}$ 转化为0-1矩阵， Dl = Dl < keep_prob
将 $a^{[l]}$ 和 $d^{[l]}$ 中的元素一一对应， $d^{[l]}$ 为1表示对应的神经元被保留，为0表示舍弃掉， Al = Al * Dl
为了确保 $a^{[l]}$ 的期望值不变，将 $a^{[l]}$ 除以 $keep\_prob$ ， Al = Al / keep_prob