原理:
参数:1,神经元被drop out的概率p,被激活的概率为1-p
2,scale_train_标志位(train过程中被激活的神经元是否乘 1/1-p)
train过程:
前向传播过程中每个神经元以1-p的概率被激活
被激活的神经元根据scale_train_标志来确定是否变大1/1-p倍
test过程
若scale_train_为1,不进行任何处理
若scale_train_为0,使用“均值网络“,每个神经元的激活值乘(1-p),即缩小
Caffe源码如下:
template <ty