深度学习总结(十)——dropout

最新推荐文章于 2024-07-25 11:20:24 发布

manong_wxd

最新推荐文章于 2024-07-25 11:20:24 发布

阅读量5.2k

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/manong_wxd/article/details/78744953

版权

本文介绍了深度学习中dropout的概念，包括反向dropout（inverted dropout）及其作用机制。通过实例解释了如何在神经网络中应用dropout，并探讨了其作为正则化手段防止过拟合的效果。此外，还提到了在不同层设置不同keep-prob的重要性，以及在计算机视觉任务中的应用和局限性。

摘要由CSDN通过智能技术生成

这里写图片描述

1. Inverted dropout

大家都知道dropout是一个概率值，它表示的是a[l] (第l层的输入)中的元素以多大的概率置零。这里我们用它的对偶变量keep-prob代替dropout，它表示的是以多大的概率保留元素。可见dropout+keep-prob=1。

现在我们以一个三层的神经网络为例，讨论keep-drop在神经网络中是如何发生作用的。

import numpy as np

keep_prod = 0.8
a3 = np.random.rand(3,4)
print("a3-before",a3)
d3 = np.random.rand(a3.shape[0],a3.shape[1])<keep_prod
print("d3",d3)
a3=np.multiply(a3,d3)
print("a3-after",a3)

上述代码显示的是第三层中keep-drop的运行过程，a[3]为第3层的输出结果，d[3]为keep-drop的index数组，它与a[3]同样大小，元素非0即1。两者对应位置相乘，a[3]中d[3]的1对应的位置，元素值保留，否则置为零。这就是keep-prod的过程，输出如下所示：

a3-before 
[[ 0.6016695   0.733025    0.38694513  0.17916196]
 [ 0.39412193  0.22803599  0.16931667  0.30190426]
 [ 0.8822327

最低0.47元/天解锁文章

manong_wxd

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录