droupout和BN层的区别

最新推荐文章于 2024-02-06 00:30:43 发布

qq_37791263

最新推荐文章于 2024-02-06 00:30:43 发布

阅读量461

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_37791263/article/details/110673739

版权

本文探讨了dropout和批量正则化（BN）层在防止过拟合中的作用。dropout通过随机失活神经元实现模型融合，减少权重依赖，提高泛化能力。BN则通过归一化层输出，缓解梯度消失问题，加速训练并提升模型稳健性。BN在测试阶段采用训练期间的均值和标准差。两者均可改善模型性能，但适用场景有所不同。

摘要由CSDN通过智能技术生成

droupout和BN层的区别

相关链接https://blog.csdn.net/yunlong_g/article/details/107402085
首先两者都是为了防止网络过拟合而进行的手段。

不同点：

1.droupout是在全连接层，随机的是一些全连接层的神经元暂时性的失活。属于一种集成学习的方法防止过拟合，在训练集中使用特征融合的思想。按照比例完成分类，或者其他任务。并不能解决梯度消失，或爆炸问题
2.BN在卷积层之后，激活函数之前，起到一个将卷积结果归一化的作用。可以有效结果梯度消失，或爆炸问题

Dropout

Dropout在训练模型中是如何实现的呢？Dropout的做法是在训练过程中按一定比例（比例参数可设置）随机忽略或屏蔽一些神经元。这些神经元被随机“抛弃”，也就是说它们在正向传播过程中对于下游神经元的贡献效果暂时消失了，反向传播时该神经元也不会有任何权重的更新。所以，通过传播过程，dropout将产生和L2范数相同的收缩权重的效果。
随着神经网络模型的不断学习，神经元的权值会与整个网络的上下文相匹配。神经元的权重针对某些特征进行调优，会产生一些特殊化。周围的神经元则会依赖于这种特殊化，如果过于特殊化，模型会因为对训练数据过拟合而变得脆弱不堪。神经元在训练过程中的这种依赖于上下文的现象被称为复杂的协同适应（complex co-adaptations）。
加入了Dropout以后，输入的特征都是有可能会被随机清除的，所以该