DCN_可变形卷积_Deformable Convolutional Networks

最新推荐文章于 2024-02-21 12:56:31 发布

鱼一一

最新推荐文章于 2024-02-21 12:56:31 发布

阅读量2.7k

点赞数 3

分类专栏：机器学习与深度学习文章标签：卷积深度学习计算机视觉

本文链接：https://blog.csdn.net/qq_40662074/article/details/106834008

版权

机器学习与深度学习专栏收录该内容

10 篇文章 1 订阅

订阅专栏

原文链接: link.

Deformable Convolutional Networks

动机：
视觉识别中的一个关键挑战是如何在目标尺度，姿态，视点和部件变形中适应几何变化或建模几何变换。

现有方法：
1.增加现有的数据样本来实现，例如通过仿射变换。
缺点：以昂贵的训练和复杂的模型参数为代价；几何变换被假定是固定并且已知的，阻止了对具有未知几何变换的新任务的泛化能力。

2.不变特征： SIFT（尺度不变特征变换）和基于滑动窗口的目标检测。
缺点：复杂的变换可能是困难的或不可行的。

3.卷积神经网络（CNNs）：大量的数据增强，一些简单的手工设计模块（最大池化可以对小的平移有不变性）
缺点： CNN模块的固定几何结构，缺乏处理几何变换的内部机制。

在这里插入图片描述
顶部：两个激活单元在顶部特征图上，在两个不同尺度和形状的物体上。激活来自于3×3滤波器。
中间：在前面的特征图上的3×3滤波器的采样位置。另外两个激活单元被高亮显示。
底部：在前面的特征图上两个级别的3×3滤波器的采样位置。突出显示的位置对应于上面突出显示的单元。
本文方法
引入了两个新的模块
在这里插入图片描述
1.可形变卷积：偏移量通过附加的卷积层从前面的特征图中学习。
因此，变形以局部的，密集的和自适应的方式受到输入特征的限制
（c）（d）是（b）的特例，表明可变形卷积泛化到了各种尺度（各向异性）、长宽比和旋转的变换
2. 可变形的RoI池化：它为前面的RoI池化的常规bin分区中的每个bin位置添加一个偏移量。类似地，从前面的特征映射和RoI中学习偏移量，使得具有不同形状的目标能够自适应的进行部件定位

在这里插入图片描述

可变形卷积的流程为：

1、原始图片batch（大小为bhwc），记为U，经过一个普通卷积，卷积填充为same，即输出输入大小不变，对应的输出结果为（bhw2c)，记为V，输出的结果是指原图片batch中每个像素的偏移量（x偏移与y偏移，因此为2c）。
2、将U中图片的像素索引值与V相加，得到偏移后的position（即在原始图片U中的坐标值），需要将position值限定为图片大小以内。position的大小为（bhw*2c)，但position只是一个坐标值，而且还是float类型的，我们需要这些float类型的坐标值获取像素。
3、例，取一个坐标值（a,b)，将其转换为四个整数，floor(a), ceil(a), floor(b), ceil(b)，将这四个整数进行整合，得到四对坐标（floor(a),floor(b)), ((floor(a),ceil(b)), ((ceil(a),floor(b)), ((ceil(a),ceil(b))。这四对坐标每个坐标都对应U中的一个像素值，而我们需要得到(a,b)的像素值，这里采用双线性差值的方式计算（一方面得到的像素准确，另一方面可以进行反向传播）。
4、在得到position的所有像素后，即得到了一个新图片M，将这个新图片M作为输入数据输入到别的层中，如普通卷积。

在这里插入图片描述

结果

其实所谓的learning offset，这个思想在faster RCNN中已经用过了，这个针对每一个像素的receptive field得到一个offset，而faster RCNN是对每一个anchor box得到offset，意思是一样的，就是input大小不一样罢了。为什么会偏移向目标呢，原因参与到训练中，这样的输入可以使得loss变小，因此offset就是往loss变小的方向偏移。这个思想在Mask RCNN中得到了进一步优化，

鱼一一

关注

3
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
DCN_可变形卷积_Deformable Convolutional Networks

原文链接: link.Deformable Convolutional Networks摘要1.介绍摘要由于卷积神经网络（CNN）的卷积核几何结构固定，因此模型几何转换有限。在这项工作中，我们引入了两个新模块来增强CNN的转换建模能力，即可变形卷积和可变形ROI Pooling。两者均基于以下想法：在模块中增加额外的空间采样位置的偏移量，并从目标任务中学习偏移量，而无需额外的监督。新模块可以轻松替换现有CNN中的普通模块，并且可以通过标准反向传播轻松进行端到端训练，从而产生可变形的卷积网络。大量的实验
复制链接

扫一扫

专栏目录