深度之眼Pytorch框架训练营第四期——正则化之 Dropout

最新推荐文章于 2023-01-14 11:52:35 发布

Ikerlz

最新推荐文章于 2023-01-14 11:52:35 发布

阅读量1k

点赞数

分类专栏：深度之眼Pytorch框架训练营第四期

本文链接：https://blog.csdn.net/Ikerlz/article/details/106474531

版权

深度之眼Pytorch框架训练营第四期专栏收录该内容

27 篇文章 28 订阅

订阅专栏

文章目录

- - 正则化之 Dropout

正则化之 Dropout

1、Dropout概念

开篇明义，dropout是指在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃。注意是暂时，对于随机梯度下降来说，由于是随机丢弃，故而每一个mini-batch都在训练不同的网络

在这里插入图片描述

如图所示，所谓的dropout，就是把某些神经元丢弃，相当于权值为0，然后进行模型的训练。
这里需要注意的是：在测试集测试时，所有权重需要乘以 1-drop_prob ，这是因为，我们需要保证训练集和测试集的数据尺度相同，举个例子，如果全连接层的前一层共有100个神经元，则对这一层的某个神经元，相当于有100个权值 $w_i$ 乘上100个 $x_i$ ，如果我们假设每一个 $w_ix_i$ 的尺度为1，则利用dropout后，有30%的神经元失活，则这个神经元的尺度就从100降到了70，这是在训练的时候使用dropout的情况，但是在测试集是，并没有神经元失活，即所有的神经元都是激活的状态，这个时候，我们需要对每个权值都乘上 1-drop_prob ，也就是70%，使得测试模型时的训练尺度也为70。

2、`Pytorch`中的`Dropout`

Pytorch中实现 dropout 操作是采用 nn.Dropout这个层进行实现，nn.Dropout继承了_DropoutNd，而_DropoutNd又继承了Module类

class Dropout(_DropoutNd):

    def forward(self, input):
        return F.dropout(input, self.p, self.training, self.inplace)

# >>>>>> _DropoutNd <<<<<< #
class _DropoutNd(Module):
    __constants__ = ['p', 'inplace']

    def __init__(self, p=0.5, inplace=False):
        super(_DropoutNd, self).__init__()
        if p < 0 or p > 1:
            raise ValueError("dropout probability has to be between 0 and 1, "
                             "but got {}".format(p))
        self.p = p
        self.inplace = inplace

    def extra_repr(self):
        return 'p={}, inplace={}'.format(self.p, self.inplace)

可以看出，一共有两个参数：

p：失活概率，默认为0.5
inplace
如下图所示，红色为不失活的情况，出现了过拟合，而蓝色虚线是drop_out=0.5的情况，有效地减小了过拟合的现象

在这里插入图片描述

如下图所示，作图为没有 dropout 时的权值分布，右图为 dropout=0.5 时的权值分布，可以看出使用dropout 后，权值分布更集中，范围更小，相当于起到了一个 weight decay 的效果。

在这里插入图片描述

3、`Pytorch` 中 `Dropout` 的实现细节

Pytorch中实现Dropout时，在训练时将权重均乘以 $1 - p$ ，即除以 $1 - p$ ，这样在测试时美酒不需要进行尺度的缩放，本质上与前面讲到的在测试时进行缩放是一样的道理。

Ikerlz

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度之眼Pytorch框架训练营第四期——正则化之 Dropout

文章目录正则化之 Dropout1、Dropout概念2、`Pytorch`中的`Dropout`3、`Pytorch` 中 `Dropout` 的实现细节正则化之 Dropout1、Dropout概念开篇明义，dropout是指在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃。注意是暂时，对于随机梯度下降来说，由于是随机丢弃，故而每一个mini-batch都在训练不同的网络如图所示，所谓的dropout，就是把某些神经元丢弃，相当于权值为0，然后进行模型的训练。
复制链接

扫一扫