13. Dropout【动手学深度学习v2】

最新推荐文章于 2024-01-16 17:17:36 发布

hei_hei_hei_

最新推荐文章于 2024-01-16 17:17:36 发布

阅读量560

点赞数

分类专栏：学习笔记文章标签：深度学习 cnn 人工智能

本文链接：https://blog.csdn.net/hei_hei_hei_/article/details/125231831

版权

13 篇文章 0 订阅

订阅专栏

torch.nn.Dropout(p=0.5, inplace=False)：p表示随机扔掉的概率
input：（ $*$ ）
output：（ $*$ ）

>>> m = nn.Dropout(p=0.2)
>>> input = torch.randn(20, 16)
>>> output = m(input)

Dropout是将一些输出项随机置0来控制模型的复杂度，一般效果很好（一般好于L2）
常作用于全连接层的输出上；而卷积由于参数少因此不易过拟合不太常用dropout；RNN中一般在不同层循环结构体之间使用dropout
dropout的p是用于控制模型复杂度的超参数（常见的取值是0.1、0.5、0.9）
补充一些看到的博客关于Dropout的观点：
在设计网络时，设定的每层神经元代表一个学习到的中间特征（即几个权值的组合），网络所有神经元共同作用来表征输入数据的特定属性（如图像分类中，表征所属类别）。当相对于网络的复杂程度（即网络的表达能力、拟合能力）而言数据量过小时，出现过拟合，显然这时各神经元表示的特征相互之间存在许多重复和冗余。
dropout的直接作用是减少中间特征的数量，从而减少冗余，即增加每层各个特征之间的正交性（数据表征的稀疏性观点也恰好支持此解释）。

参考博客：dropout层