DropBlock: A regularization method for convolutional networks
dropout的不足
dropout是深度学习中避免过拟合的手段之一,经典网路结构中,dropout都被放到全连接层之后,鲜有放到卷积层之后。这是因为实验证明卷积层后的dropout层对网络泛化能力的改进微乎其微,本文分析了其中的原因:卷积层输出特征图各个元素之间存在很强的相关性,随机把某些原始置为0,其邻域元素带有何其相似的信息,dropout的功能没法实现。基于这个分析,本文提出了针对卷积层输出特征的dropout改进版:dropblock,不是随机把某些元素置零,而是随机把某些block都置零。如下图所示。
实现
dropblock有两个参数:block_size和 γ \gamma