对Dropout的理解精简版

最新推荐文章于 2024-02-02 13:08:48 发布

furuit

最新推荐文章于 2024-02-02 13:08:48 发布

阅读量1.3k

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fu6543210/article/details/84302298

版权

今天第一次在别人的代码里面看到了dropout 这个功能，找了一下相关的资料大概理解了一些。论文地址

概念

dropout其实挺简单的，一句话说就是每次train的时候（test不会参与dropout），按照一定几率P随机丢弃一些feature或者Input（因为dropout所处的层不同，叫法不同），具体做法是把这一项feature设置成0，也不更新权重（不参与bp传播），其他过程不变。但是它的权重得保留下来（只是暂时不更新而已），因为下次样本输入时它可能又得工作了。
然后把剩下的1-p 没有丢弃的feature或者input 按照 1/P 的倍率放大。

动机

dropout是为了解决大网络但是小训练集的过拟合问题，但是可以一般性的避免过拟合。

这里总结一下我所知道的避免过拟合的方法

early stopping
L1 and L2 regularization
dropout

如何选择dropout 的概率

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。