《动手学深度学习》第八天--丢弃法

最新推荐文章于 2024-08-03 16:08:53 发布

打着灯笼摸黑

最新推荐文章于 2024-08-03 16:08:53 发布

阅读量369

点赞数 1

分类专栏：《动手学深度学习》

本文链接：https://blog.csdn.net/qq_39594939/article/details/97244888

版权

《动手学深度学习》专栏收录该内容

37 篇文章 46 订阅

订阅专栏

深度学习模型常常使用丢弃法（dropout）来应对过拟合问题，本节中提到的丢弃法特指倒置丢弃法（inverted dropout）。

（一）方法

由于丢弃法在训练中隐藏层神经元的丢弃是随机的，输出层的计算无法过度依赖隐藏单元中的任一个，从而可以用来应对过拟合。

（二）从零开始实现

下面的dropout函数将以drop_prob的概率丢弃NDArray输入X中的元素。

mxnet.ndarray.random.uniform(low=0, high=1, shape=_Null, dtype=_Null, ctx=None, out=None, **kwargs)
从均匀分布中抽取随机样本。样本均匀分布在半开放区间[低、高(包括低，但不包括高)。

定义函数dropout(X, drop_prob)：
若丢弃概率为1，即保持概率为0，那么输出和X形状一样的0矩阵
若丢弃概率在0–1之间，利用random.uniform函数从均匀分布中生成和X形状一样的样本mask，我们来看一下这个过程：
在这里插入图片描述

定义模型参数：
定义一个包含两个隐藏层的多层感知机，其中两个隐藏层的输出个数都是256。需要3个W，和3个b参数。

定义模型：
下面定义的模型将全连接层和激活函数ReLU串起来，并对每个激活函数的输出使用丢弃法。
先回顾一下下面两个函数的用法：
在这里插入图片描述
定义的模型利用relu()将全连接层和激活函数连接起来，接着利用函数is_training()来判断是在训练还是测试，只在训练时使用丢弃法。第一层完成后第二层重复操作。