卷积神经网络：Dropout篇

最新推荐文章于 2024-02-28 01:32:59 发布

VIP文章 Inc_Cool

最新推荐文章于 2024-02-28 01:32:59 发布

阅读量5.7k

点赞数 1

分类专栏：卷积神经网络文章标签： Dropout 卷积神经网络

本文链接：https://blog.csdn.net/qq_25073253/article/details/72457840

版权

Dropout作用

    在hinton的论文Improving neural networks by preventing coadaptation提出的，主要作用就是为了防止模型过拟合。当模型参数较多，训练数据较少时候，根据线性代数相关知识可以知道，当前模型可以非常完美的拟合我们的曲线。但该模型对测试数据集可能就没有很好的表现了，也就是说训练出的模型泛化能力很弱，我们称之为过拟合。从文章题目通过阻止特征检测器的共同作用来提高神经网络的性能可以看出，网络在提取训练集特征时，舍弃掉了一部分特征来提高网络的泛化能力。

基本认识

   Dropout用网络训练时工作变化来定义的话，是指在模型训练时随机让某些神经单元的权重停止本次更新，等下次训练时就有可能更新，对与一层中每个神经单元来说，它们更新的概率是相同的。
   在hinton论文中没有数学公式，只是作者直观解释：

     1. 网络中某层神经单元权值更新是等概率的，因此，不能保证相邻的神经单元每次都更新，直观解释就是有些特征不必完全依托于其他的特征。举个栗子：假如有5兄弟，老大和老二，老二和老三、、、相邻两个人才能完成一个任务，现在呢，我们把5兄弟放在黑屋子里面，每次随机选择一个兄弟执行任务，如果完成不了就惩罚其他兄弟，同时被选中的大兄弟当面对自己这次没有完成任务来自我反思（权值更新），在我们的逼迫下，进行了N次随机选择，发现5兄弟都能通过自我努力（权值更新）独立完成任务。
     2. 论文讲，把dropout看作是，针对每次batch_size大的样本集训练，

最低0.47元/天解锁文章

Inc_Cool

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
卷积神经网络：Dropout篇

Dropout作用在hinton的论文Improving neural networks by preventing coadaptation提出的，主要作用就是为了防止模型过拟合。当模型参数较多，训练数据较少时候，根据线性代数相关知识可以知道，当前模型可以非常完美的拟合我们的曲线。但该模型对测试数据集可能就没有很好的表现了，也就是说训练出的模型泛化能力很弱，我们称之为过拟合。从文章题目通过阻止特征
复制链接

扫一扫