深度学习可形变卷积

可形变卷积网络(Deformable ConvNets)通过学习附加偏移量增强CNNs的几何变换能力,应用于物体检测和语义分割。文中介绍了可形变卷积和可形变RoI池化,通过这两个模块改善Faster R-CNN和R-FCN等模型的性能,同时在COCO Detection和Segmentation挑战赛中取得优秀成绩。RepPoints作为RepPoints Detector(RPDet)的基础,提供更精细的目标表示,结合可变形卷积以提高定位和分类准确性。
摘要由CSDN通过智能技术生成

深度学习可形变卷积

Deformable Convolutional Networks

参考文献链接:https://arxiv.org/pdf/1703.06211.pdf

参考代码链接:
https://github.com/ msracver/Deformable-ConvNets

可形变卷积

卷积神经网络(CNNs)由于其构建模块中固定的几何结构,其固有的局限性在于模型的几何变换。在这项工作中,引入了两个新的模块来增强CNNs的转换建模能力,即可变形卷积和可变形RoI池。这两种方法都基于这样的思想,即在不需要额外监视的情况下,使用附加偏移量来增加模块中的空间采样位置,并从目标任务中学习偏移量。新的模块可以很容易地取代现有cnn中的普通模块,并且可以通过标准的反向传播进行端到端的简单训练,从而产生可变形卷积网络。大量实验验证了该方法在复杂的目标检测和语义分割视觉任务中的有效性。

使用可变形卷积,可以提升Faster R-CNN和R-FCN在物体检测和分割上的性能。只要增加很少的计算量,就可以得到性能的提升。

在这里插入图片描述

传统/常规卷积基于定义的滤波器大小,在输入图像或一组输入特征图的预定义矩形网格上操作。该网格的大小可以是3×3和5×5等。然而,想要检测和分类的对象可能会在图像中变形或被遮挡。

在DCN中,网格是可变形的,因为每个网格点都可以通过一个可学习的偏移量移动。卷积作用于这些移动的网格点上,因此称为可变形卷积,类似于可变形RoI池化的情况。通过使用这两个新模块,DCN提高了DeepLab、Faster R-CNN、R-FCN、和FPN等的准确率。

最后,MSRA使用DCN+FPN+Aligned Xception在COCO Detection Challenge中获得第二名,Segmentation Challenge中获得第三名。发表于2017 ICCV,引用次数超过200次。

  1. 可变形卷积

在这里插入图片描述

可变形卷积

· 规则的卷积是在一个规则的网格R上操作的。

· 对R进行可变形卷积运算,但每个点都增加一个可学习的偏移∆pn。

· 卷积生成2N个特征图,对应N个2D个偏移量∆pn(每个偏移量对应有x-方向和y-方向)。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值