学习笔记十二——Deformable Convolutional Networks

最新推荐文章于 2022-10-18 10:15:47 发布

Shl_1024

最新推荐文章于 2022-10-18 10:15:47 发布

阅读量443

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Shl_1024/article/details/103741663

版权

一、提出问题

视觉识别中一个关键挑战是如何在目标尺度，姿态，视点和部件变形中适应几何变化或建模几何变换，即适应物体的形变。

现有解决方法：1）建立具有足够期望变化的训练数据集。例如通过仿射变换增加现有数据样本，即学习足够多的数据使模型能够适应各种形状的物体。

2）使用变换不变的特征和算法。如SIFT（尺度不变特征变换）和基于滑动窗口的目标检测。

存在的缺点：1）针对第一个解决方法，几何变换被假定是固定并且已知的。这阻止了对具有未知几何变换新任务的泛化能力。

2）手工设计的不变特征和算法对于过于复杂的变换可能是不可行的。

同样的，卷积神经网络对几何变换建模的能力主要来自大量的数据增强，大的模型容量以及一些简单的手工设计模块，所以也受限于此。CNN缺乏处理几何变换的内部机制,这会导致明显的问题。

解决方法：本文提出了两个模块。可变形卷积，它将2D偏移添加到标准卷积中的常规网格采样位置上。它可以使采样网格自由形变。偏移量通过附加的卷积层从前面的特征图中学习。

可变形的RoI池化。它为前面的RoI池化的常规bin分区中的每个bin位置添加一个偏移量[15,7]。类似地，从前面的特征映射和RoI中学习偏移量，使得具有不同形状的目标能够自适应的进行部件定位。

二、可变形卷积网络Deformable Convolutional Networks

传统卷积结构,pn是卷积输出每一个点相对于感受野上的每一个点的偏移量：

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
学习笔记十二——Deformable Convolutional Networks

一、提出问题视觉识别中一个关键挑战是如何在目标尺度，姿态，视点和部件变形中适应几何变化或建模几何变换，即适应物体的形变。现有解决方法：1）建立具有足够期望变化的训练数据集。例如通过仿射变换增加现有数据样本，即学习足够多的数据使模型能够适应各种形状的物体。2）使用变换不变的特征和算法。如SIFT（尺度不变特征变换）和基于滑动窗口的目标检测。存在的缺点：1）针对第一个解决方法，几何变换...
复制链接

扫一扫

专栏目录

博客等级

码龄7年

28
原创

5
点赞

33
收藏

5
粉丝

关注

私信

热门文章

分类专栏

最新评论

学习笔记18--SiamRPN
WindofDemon: 请问跟踪阶段模板帧第一帧是我们框定出来的，如果目标比127*127要大呢？做resize吗？这样不就丢失了图像的长宽比信息么

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。