为了防止过拟合,我们可以对网络实行dropout操作,有三种方法可以实现:
-
torch.nn.functional.dropout(input, p, training=self.training)
该种方法实现时必须标明training的状态为self.training, 即与模型当前的状态相同。当模型处于训练状态时通过model.train()来将training的状态设为true, 当处于测试状态时通过model.eval()来将training状态设为false. -
torch.nn.Dropout( p )
该方法不需要设置training状态,会将所有元素以一定概率p置0 -
torch.nn.Dropout2d( p )
该方法同样不需要设置training状态,与方法2不同的是会对某个通道按照概率p置0.
dropout之后,input的数值也会发生变化,input’=input/(1-p)
如有错误,请多指教。