【深度学习】丢弃法（dropout）

最新推荐文章于 2024-08-03 16:08:53 发布

苦逼的虾

最新推荐文章于 2024-08-03 16:08:53 发布

阅读量1.7k

点赞数 1

分类专栏：深度学习文章标签：深度学习丢弃法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33432841/article/details/107882686

版权

深度学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

丢弃法

在小虾的这篇文章中介绍了权重衰减来应对过拟合问题（https://blog.csdn.net/qq_33432841/article/details/107879937），下面在介绍一种应对过拟合问题的方法丢弃法。因为丢弃法有许多不同的变体，下面提到的丢弃法特指倒置丢弃法。

方法：

在“多层感知机”（https://blog.csdn.net/qq_33432841/article/details/107858405）中，描述了一个单隐藏层的多层感知机，其中输入个数为4，隐藏单元个数为5，且隐藏单元ℎ𝑖（𝑖=1,…,5）的计算表达式为

这里𝜙是激活函数，𝑥1,…,𝑥4是输入，隐藏单元𝑖的权重参数为𝑤1𝑖,…,𝑤4𝑖，偏差参数为𝑏𝑖。

当对该隐藏层使用丢弃法时，该层的隐藏单元将有一定概率被丢弃掉。设丢弃概率为𝑝，那么有𝑝的概率ℎ𝑖会被清零，有1−𝑝的概率ℎ𝑖会除以1−𝑝做拉伸。丢弃概率是丢弃法的超参数。具体来说，设随机变量𝜉𝑖为0和1的概率分别为𝑝和1−p。使用丢弃法时我们计算新的隐藏单元

由于𝐸(𝜉𝑖)=1−𝑝，因此

即丢弃法不改变其输入的期望值。

那么让我们对“多层感知机”中图的隐藏层使用丢弃法，一种可能的结果如下图所示。

在图中ℎ2和ℎ5被清零，这时输出值的计算不再依赖ℎ2和ℎ5，在反向传播时，与这两个隐藏单元相关的权重的梯度均为0。由于在训练中隐藏层神经元的丢弃是随机的，即ℎ1,…,ℎ5都有可能被清零，输出层的计算无法过度依赖ℎ1,…,ℎ5中的任一个，从而在训练模型时起到正则化的作用，并可以用来应对过拟合。

在测试模型时，为了得到更加确定性的结果，一般不使用丢弃法。

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【深度学习】丢弃法（dropout）

丢弃法在小虾的这篇文章中介绍了权重衰减来应对过拟合问题（https://blog.csdn.net/qq_33432841/article/details/107879937），下面在介绍一种应对过拟合问题的方法丢弃法。因为丢弃法有许多不同的变体，下面提到的丢弃法特指倒置丢弃法。方法：在“多层感知机”（https://blog.csdn.net/qq_33432841/article/details/107858405）中，描述了一个单隐藏层的多层感知机，其中输入个数为4...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。