faster rcnn代码解读（一）特征提取

最新推荐文章于 2024-07-06 14:25:51 发布

shchojj

最新推荐文章于 2024-07-06 14:25:51 发布

阅读量2.8k

点赞数 1

分类专栏： object detection

本文链接：https://blog.csdn.net/fanre/article/details/105305911

版权

object detection 专栏收录该内容

15 篇文章 1 订阅

订阅专栏

faster rcnn代码解读参考

：https://github.com/adityaarun1/pytorch_fast-er_rcnn

https://github.com/jwyang/faster-rcnn.pytorch

实际上是一遍整理一遍修改吧。

这里借用的是vgg16的迁移学习（transfer learning）进行的或者说微调（fine-tuning)。

一、关于vgg16网络参数载入及冻结

我直接把vgg16打印出来

VGG16(
  (vgg): VGG(
    (features): Sequential(
      (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (1): ReLU(inplace=True)
      (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (3): ReLU(inplace=True)
      (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
      (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (6): ReLU(inplace=True)
      (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (8): ReLU(inplace=True)
      (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
      (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (11): ReLU(inplace=True)
      (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (13): ReLU(inplace=True)
      (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (15): ReLU(inplace=True)
      (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
      (17): Conv2d(256, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (18): ReLU(inplace=True)
      (19): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (20): ReLU(inplace=True)
      (21): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (22): ReLU(inplace=True)
      (23): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
      (24): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (25): ReLU(inplace=True)
      (26): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (27): ReLU(inplace=True)
      (28): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (29): ReLU(inplace=True)
    )
    (avgpool): AdaptiveAvgPool2d(output_size=(7, 7))
    (classifier): Sequential(
      (0): Linear(in_features=25088, out_features=4096, bias=True)
      (1): ReLU(inplace=True)
      (2): Dropout(p=0.5, inplace=False)
      (3): Linear(in_features=4096, out_features=4096, bias=True)
      (4): ReLU(inplace=True)
      (5): Dropout(p=0.5, inplace=False)
    )
  )
)

可以看到vgg16包含三个部分：feature特征提取、avgpool为全连接降维度、classifier分类。

class VGG16(nn.Module):
    def __init__(self,model_path ):
        super(VGG16, self).__init__()
        self.vgg = models.vgg16().to(cfg['device'])        
        if cfg['net_mode']=='train':
            print("Loading pretrained weights from %s" % (model_path))
            state_dict = torch.load(model_path)
            self.vgg.load_state_dict({k: v for k, v in state_dict.items() if k in self.vgg.state_dict()})
        self.vgg.classifier = nn.Sequential(*list(self.vgg.classifier._modules.values())[:-1])
        self.vgg.features = nn.Sequential(*list(self.vgg.features._modules.values())[:-1])
        for layer in range(10):
            for p in self.vgg.features[layer].parameters():
                p.requires_grad = False

    def forward(self, x):
        out = self.vgg.features(x)
        return out,self.vgg.classifier

常用的套路，features都特征提取直接拿过来用，载入参数后直接冻结。而classifier层这里只是因为后面做rcnn分类的时候少些几行代码，这个可以忽略，自己手写都没毛病。

二、我后面把vgg16又包了一层：

class FeatureNet(nn.Module):
    def __init__(self):
        super(FeatureNet, self).__init__()
        model_path = cfg['pretrained_model']
        if cfg['feature_net'] =='vgg16':
            self.feature_net =VGG16(model_path)
    def forward(self, inputs):
        features,classifier = self.feature_net(inputs)
        return features,classifier

没有什么其他目的，就是为了让faster rcnn看起来层次更好一点，因为features提取既可以用vgg16，也可以用点别的网络

shchojj

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
faster rcnn代码解读（一）特征提取

faster rcnn代码解读参考：https://github.com/adityaarun1/pytorch_fast-er_rcnn https://github.com/jwyang/faster-rcnn.pytorch实际上是以便整理以便修改吧。这里借用的是vgg16的迁移学习（transfer learning）进行的或者说微调（fine-tuning)。一...
复制链接

扫一扫

专栏目录