深度学习笔记(2)：1.6 dropout正则化 | 1.7 why dose drop-out work?

最新推荐文章于 2024-04-18 20:11:12 发布

起个名字好难.JPG

最新推荐文章于 2024-04-18 20:11:12 发布

阅读量926

点赞数 2

分类专栏：深度学习文章标签： drop-out drop-out作用深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kkkkkiko/article/details/81164363

版权

本文介绍了深度学习中的dropout正则化技术，包括其工作原理和反向随机失活方法。通过在训练阶段随机失活神经元，dropout避免了模型过度依赖特定特征，有助于减轻过拟合。在预测阶段，不需要使用dropout。dropout通常在计算机视觉任务中作为正则化手段，但也存在挑战，如目标函数不确定性导致的调试困难。

摘要由CSDN通过智能技术生成

1.6 dropout正则化

dropout又称随机失活，它是通过给定概率随机失活一些节点，让网络更加简单。

下面介绍一个最常用的方法：‘inverted dropout’ (反向随机失活)

假设我们有一个三层的神经网络，每一层节点keep的概率是0.8，而失活的概率是0.2。

该怎么操作呢？

想法是按照保留概率，生成一个对应维度的0-1矩阵，1代表这个节点被保留，而0表示这个节点被失活。

如上图d3那一行命令，先生成一个对应维度的矩阵，其中每个元素都是服从0-1均匀分布的随机数，而在这些随机数中，小于0.8的值我们记为1。对于均匀分布，我们知道一个数小于0.8的概率就是0.8，所以通过这个操作我们可以使所有节点中有近0.8的节点被保留，而0.2的被失活。

然后a3*d3(elementwise)，我们得到这一轮迭代过程中的系数矩阵(d3等于1的系数在a3中被保留)，绿框中的操作是为了修正或弥补因为dropout操作而遗漏的那部分，以保证Z期望不变。比如我们有50个节点，在失活概率为0.2的情况下，约有10个节点被失活，这时我们求Z时就会因为这些失活的节点而影响Z值的计算，所以为了保证Z的期望不变，我们用a除以keep-prob以保证Z的期望不变。

最低0.47元/天解锁文章

起个名字好难.JPG

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习笔记(2)：1.6 dropout正则化 | 1.7 why dose drop-out work?

1.6 dropout正则化dropout又称随机失活，它是通过给定概率随机失活一些节点，让网络更加简单。下面介绍一个最常用的方法：‘inverted dropout’ (反向随机失活)假设我们有一个三层的神经网络，每一层节点keep的概率是0.8，而失活的概率是0.2。该怎么操作呢？想法是按照保留概率，生成一个对应维度的0-1矩阵，1代表这个节点被保留，而0表示这个节...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。