Dropout

最新推荐文章于 2019-12-26 15:07:35 发布

千寻千梦

最新推荐文章于 2019-12-26 15:07:35 发布

阅读量806

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34531825/article/details/72842340

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

深度学习中的过拟合问题

表现：在训练集上Loss和Accuracy都表现很好，而在测试集上一塌糊涂，训练模型基本上没有什么用处。
过拟合产生原因：处理的是样本量较小，而DNN超强的拟合能力，所以很容易造成过拟合的情况出现。【文献5】

另外，比如在文本分类上，dropout效果提升有限，分析原因可能是Reuters-RCV1数据量足够大，过拟合并不是模型的主要问题【文献1】

怎么判断是欠拟合还是过拟合？

模型预测效果不佳时，怎么判断是欠拟合还是过拟合？

使用简单的模型去拟合复杂数据时，会导致模型很难拟合数据的真实分布，这时模型便欠拟合了，或者说有很大的 Bias，Bias 即为模型的期望输出与其真实输出之间的差异；

有时为了得到比较精确的模型而过度拟合训练数据，或者模型复杂度过高时，可能连训练数据的噪音也拟合了，导致模型在训练集上效果非常好，但泛化性能却很差，这时模型便过拟合了，或者说有很大的 Variance，这时模型在不同训练集上得到的模型波动比较大。【来自文献5】

DNN网络有那些控制过拟合方法？

（1）early stopping
（2）数据集扩增（Data augmentation）
（3）正则化（Regularization）包括L1、L2（L2 regularization也叫weight decay）
（4）dropout。
详细参考：http://blog.csdn.net/helei001/article/details/53186686

如何理解Droupout？

在哪个层Droupout？

预测时怎么办？

Dropout与正则化在tensorflow中的实现

参考文献
【1】http://blog.csdn.net/stdcoutzyx/article/details/49022443 理解dropout
【2】Dropout: A Simple Way to Prevent Neural Networks from Over ting
Nitish Srivastava Georey Hinton
【3】DROPOUT AS DATA AUGMENTATION https://arxiv.org/pdf/1506.08700.pdf
【4】http://blog.csdn.net/u012702874/article/details/45030991 对 CNN 中 dropout layer 的理解
【5】http://www.07net01.com/2017/05/1865263.html DNN中防止过拟合的方法
【6】http://blog.csdn.net/helei001/article/details/53186686 正则化方法：L1和L2 regularization、数据集扩增、dropout

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。