【深度学习】随机失活 (dropout)

JNingWei

已于 2023-01-25 16:31:54 修改

阅读量2.3k

点赞数 1

分类专栏：深度学习文章标签：深度学习人工智能计算机视觉

于 2018-02-02 15:49:06 首次发布

本文链接：https://blog.csdn.net/JNingWei/article/details/79240037

版权

深度学习专栏收录该内容

79 篇文章 60 订阅

订阅专栏

Introduction

随机失活，dropout，2012年于AlexNet中被提出。

Note :

只针对 全连接层 进行操作；
训练阶段和测试阶段的操作不同；
可解释为一种特殊的 模型融合 (集成学习) 方式；
也可解释加入了 dropout正则化 (正则化的一种)；
还可以解释为 加噪声 以 提高鲁棒性。

训练阶段

按概率p 随机 将神经元 置 0 [如下(b)图]，以 缓解神经元之间隐形的协同适应，从而达到降低模型复杂度的目的：
这里写图片描述

别看dropout之后的网络只是原网络的一个 子网络 ，复杂度不比原网络。但由于每个神经元的dropout是 随机dropout，因此每一轮都相当于在一个新的子网络上训练。那么最终得到的模型便是 无数个 子网络 共同训练 的成果，效果自然会更好。

然后麻烦也来了，训练阶段的每个神经元要事先添加一道概率流程：
这里写图片描述

对应的公式变化如下如下：

没有dropout的神经网络：
有dropout的神经网络：

Tensorflow 中的 dropout API 如下：

tf.nn.dropout

其中，根据 keep_prob参数项随机进行 dropout 。

# coding=utf-8

import tensorflow as tf
import numpy as np

inputs = np.random.uniform(-10, 10, size=[3, 3])
features = tf.placeholder_with_default(input=inputs, shape=[3, 3])

# 随机失活
output_dropout = tf.nn.dropout(features, keep_prob=0.5)

with tf.Session() as sess:
    print ("\nfeatures :\n{}".format(sess.run(features)))
    print ("\n----------\n")
    print ("\ndropout :\n{}".format(sess.run(output_dropout)))

features :
[[ 0.53874537 -3.09047282 -2.88714205]
 [-1.92602402 -1.56025457  3.64309646]
 [-9.13147387  8.37367913 -7.9849204 ]]

----------

dropout :
[[  0.          -6.18094565  -5.77428411]
 [ -0.          -3.12050914   7.28619293]
 [-18.26294775  16.74735827  -0.        ]]