TensorFlow Dropout
Dropout 是一个降低过拟合的正则化技术。它在网络中暂时的丢弃一些单元(神经元),以及与它们的前后相连的所有节点。图 1 是 dropout 的工作示意图。
TensorFlow 提供了一个 tf.nn.dropout()
函数,你可以用来实现 dropout。
让我们来看一个 tf.nn.dropout()
的使用例子。
keep_prob = tf.placeholder(tf.float32) # probability to keep units
hidden_layer = tf.add(tf.matmul(features, weights[0]), biases[0])
hidden_layer = tf.nn.relu(hidden_layer)
hidden_layer = tf.nn.dropout(hidden_layer, keep_prob)
logits = tf.add(tf.matmul(hidden_layer, weights[1]), biases[1])
上面的代码展示了如何在神经网络中应用 dropout。
tf.nn.dropout()
函数有两个参数:
-
hidden_layer
:你要应用 dropout 的 tensor -
keep_prob
:任何一个给定单元的留存率(没有被丢弃的单元)
keep_prob
可以让你调整丢弃单元的数量。为了补偿被丢弃的单元,tf.nn.dropout()
把所有保留下来的单元(没有被丢弃的单元)* 1/keep_prob
在训练时,一个好的keep_prob
初始值是0.5
。
在测试时,把 keep_prob
值设为1.0
,这样保留所有的单元,最大化模型的能力。