什么是dropout?

最新推荐文章于 2024-01-16 17:17:36 发布

zjz_xn

最新推荐文章于 2024-01-16 17:17:36 发布

阅读量1k

点赞数 2

分类专栏：神经网络文章标签：神经网络机器学习深度学习

原文链接：https://zhuanlan.zhihu.com/p/77609689

版权

神经网络专栏收录该内容

31 篇文章 3 订阅

订阅专栏

最近有个新闻闹得沸沸扬扬，那就是dropout这个算法竟然被谷歌申请了专利

真是神奇了，加减乘除还能被申请专利？

不过大家不用担心，dropout肯定用还是可以用的，谷歌只是想特定时刻，利用专利保护或者对抗某些竞争对手或者不良企业

那么今天我们就来看看，这个dropout到底是如何一顿操作猛如虎，让谷歌能花费3年时间就为了一个简单的算法申请专利

dropout 从字面意思就是‘丢掉’

丢掉？丢掉什么？

别急，我们来看看？
在这里插入图片描述
上图特征清晰明了，相必大家一眼就能认出是谁了把

根据这些特征，神经网络也能认出来，so easy
在这里插入图片描述
ok，那我们增加难度，丢掉一些特征，如下图

你是不是立马就认出来了？

同样的对模型也这么做，我们把提取衣服特征的神经元去掉，模型鲁棒性就更强，为什么？因为模型学到

认人，看脸就行，衣服什么的，无所谓

但这样模型非得看到左右脸才行，神经元提取的特征耦合度太高，我必须左右脸同时出现，模型才能作出判断，神经网络的鲁棒性仍然不够，怎么办？

我再随机抽取一半的神经元，让他们不参与任何计算，也不参与到权重的更新，比如这样

在这里插入图片描述
（打红叉表示不参与计算，不是被删掉的意思）

或者这样
在这里插入图片描述
当然，还有这种：

一般人光看xiong是认不出这是大幂幂的

这种情况就是dropout rate 设置太大，我们这是0.5，在训练的时候不幸丢掉了重点特征，造成模型overfitting了

当然有些同学说，老师老师，更据我多年阅人无数的经验，我认得出来
一般情况，dropout rate 设为0.3-0.5即可

所以你看，每次训练都随机让一定神经元停止参与运算，简单的操作让我们由一个模型演变成四个模型：
在这里插入图片描述
一个模型的作用效果，也转变成4个模型的效果和，更像一个多模型投票

所以，虽然第四个模型overfitting了，但是前三个也模型参与投票判断，第四个模型overfitting就被弱化了

所以，dropout的出现，使得模型稳定性和鲁棒性被大大提高了

到这，你应该是理解dropout 的原理和作用了，但是还有关键的一步

那就是训练的时候会停止训练一些神经元，但是测试的时候，整个模型是完整，可不会dropout 任何神经元啊

这样就出现了一个问题，就好比

平时训练200米跑步，突然比赛是400米
在这里插入图片描述
所以，在训练的时候，我们会对没有被dropout的神经元权值做一个rescale

rescale rate = 1 / (1 - dropout rate)

我们这dropout rate = 0.5，为了方便理解，我画了一个大概的过程如下图：
在这里插入图片描述

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
什么是dropout?

最近有个新闻闹得沸沸扬扬，那就是dropout这个算法竟然被谷歌申请了专利真是神奇了，加减乘除还能被申请专利？不过大家不用担心，dropout肯定用还是可以用的，谷歌只是想特定时刻，利用专利保护或者对抗某些竞争对手或者不良企业那么今天我们就来看看，这个dropout到底是如何一顿操作猛如虎，让谷歌能花费3年时间就为了一个简单的算法申请专利dropout 从字面意思就是‘丢掉’丢掉？丢掉什么？别急，我们来看看？上图特征清晰明了，相必大家一眼就能认出是谁了把根据这些特征，神经网络也能认出来，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。