dropblock torch

本文介绍了DropBlock的PyTorch实现,重点强调了官方推荐的配置:Block_size为7时验证准确率最佳,采用线性下降的Keep_prob调度策略能提升性能。此外,对比实验显示在ResNet-50的第3、4个block同时应用DropBlock比仅在第4个block应用更有效,而且在卷积层和skip connection同时应用Dropout效果更佳。
摘要由CSDN通过智能技术生成

 

https://github.com/Randl/DropBlock-pytorch/blob/master/DropBlock.py

 

官方:

Block_size=7时,获得最高验证集准确性

对Keep_prob值进行线性下降方式(scheduling)可以获得更好效果

Resnet-50的第3,4个block加Drouout比只在第4个block加Drouout更有效

在Resnet-50的卷积层和skip connection都使用Drouout效果更好
 

 

import torch
import torch.nn.functional as F
from torch import nn


class DropBlock2D(nn.Module):
    r"""Randomly zeroes spatial blocks of the input tensor.
    As described in the paper
    `DropBlock: A regularization method for convolutional networks`_ ,
    dropping whole blocks of feature map allow
以下是DropBlock的完整代码实现,包括定义DropBlock类和实现DropBlock的前向传播和反向传播函数: ```python import torch import torch.nn as nn import torch.nn.functional as F class DropBlock(nn.Module): def __init__(self, p=0.5, block_size=7): super(DropBlock, self).__init__() self.p = p self.block_size = block_size def forward(self, x): if not self.training or self.p == 0: return x gamma = self._compute_gamma(x) mask = (torch.rand_like(x) < gamma).float() block_mask = self._compute_block_mask(mask) out = x * block_mask[:, :, :x.size(2), :x.size(3)] return out / (1 - gamma) def _compute_block_mask(self, mask): left_pad = self.block_size // 2 right_pad = self.block_size - left_pad - 1 block_mask = F.max_pool2d( F.pad(mask, (left_pad, right_pad, left_pad, right_pad)), kernel_size=(self.block_size, self.block_size), stride=1, padding=0, ) if self.block_size % 2 == 0: block_mask = block_mask[:, :, :-1, :-1] return 1 - block_mask def _compute_gamma(self, x): feat_size = x.size(2) return ( self.p * feat_size ** 2 / ((feat_size - self.block_size + 1) ** 2) * (feat_size ** 2 / (feat_size ** 2 - self.block_size ** 2)) ) def __repr__(self): return f"DropBlock(p={self.p}, block_size={self.block_size})" ``` DropBlock的实现和Dropout类似,都是在模型训练时随机丢弃一部分神经元。但DropBlock的实现更加细致和精确,可以更好地保留特征图的空间结构。DropBlock的核心思想是在特征图上随机选择一个块,并将该块内的所有像素值归零。这个块的大小为`block_size`,是DropBlock的一个超参数。在实现中,我们首先根据概率`p`计算出每个像素被保留的概率`gamma`,然后根据`gamma`随机生成一个掩码`mask`,最后根据`mask`计算出一个块掩码`block_mask`,并将该块内的像素值归零。 DropBlock的实现中,我们还定义了一个私有方法`_compute_gamma`,用于计算每个像素被保留的概率`gamma`。`gamma`的计算涉及到特征图的大小和块的大小,需要根据DropBlock的超参数来计算。 最后,我们还定义了DropBlock类的`__repr__`方法,用于打印DropBlock的超参数。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI算法网奇

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值