dropout层加在哪里_CNN中dropout层的理解

最新推荐文章于 2022-12-20 16:00:10 发布

鹤栖梧桐

最新推荐文章于 2022-12-20 16:00:10 发布

阅读量9k

点赞数 1

文章标签： dropout层加在哪里

本文链接：https://blog.csdn.net/weixin_36184940/article/details/112015463

版权

dropout是在训练神经网络模型时，样本数据过少，防止过拟合而采用的trick。那它是怎么做到防止过拟合的呢？

首先，想象我们现在只训练一个特定的网络，当迭代次数增多的时候，可能出现网络对训练集拟合的很好(在训练集上loss很小)，但是对验证集的拟合程度很差的情况。所以，我们有了这样的想法：可不可以让每次跌代随机的去更新网络参数(weights)，引入这样的随机性就可以增加网络generalize 的能力。所以就有了dropout 。

在训练的时候，我们只需要按一定的概率(retaining probability)p 来对weight layer 的参数进行随机采样，将这个子网络作为此次更新的目标网络。可以想象，如果整个网络有n个参数，那么我们可用的子网络个数为 2^n 。并且，当n很大时，每次迭代更新使用的子网络基本上不会重复，从而避免了某一个网络被过分的拟合到训练集上。

那么测试的时候怎么办呢？一种最naive的方法是，我们把 2^n 个子网络都用来做测试，然后以某种 voting 机制将所有结果结合一下(比如说平均一下下)，然后得到最终的结果。但是，由于n实在是太大了，这种方法实际中完全不可行！所以有人提出，那我做一个大致的估计不就得了，我从2^n个网络中随机选取 m 个网络做测试，最后在用某种voting 机制得到最终的预测结果。这种想法当然可行，当m很大时但又远小于2^n时，能够很好的逼近原2^n个网络结合起来的预测结果。但是，有没有更好的办法呢？ of course！那就是dropout 自带的功能，能够通过一次测试得到逼近于原2^n个网络组合起来的预测能力࿰

最低0.47元/天解锁文章

鹤栖梧桐

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
dropout层加在哪里_CNN中dropout层的理解

dropout是在训练神经网络模型时，样本数据过少，防止过拟合而采用的trick。那它是怎么做到防止过拟合的呢？首先，想象我们现在只训练一个特定的网络，当迭代次数增多的时候，可能出现网络对训练集拟合的很好(在训练集上loss很小)，但是对验证集的拟合程度很差的情况。所以，我们有了这样的想法：可不可以让每次跌代随机的去更新网络参数(weights)，引入这样的随机性就可以增加网络generalize...
复制链接

扫一扫

dropout层加在哪里_CNN中dropout层的理解

“相关推荐”对你有帮助么？