D7-DCN解读

DCN

DCN论文的贡献是提出Deformable Conv。

论文创新:
1、Deformable Conv
2、Deformable ROI pooling

1、背景

深度学习对图像处理往往需要大量的数据集训练,是因为我们需要让网络学习到所有可能存在的情况,所以我们采用了数据增强的方法,如旋转、左右移、上下移、裁剪等操作。

但是针对图像目标尺度、姿态、角度、局部的变形等情况,基于经典卷积固定的几何结构,我们并不能完全模拟出来。
在这里插入图片描述

2、方法

于是,作者提出Deformable,对于3×3卷积核,经典卷积是第一幅图那样简单,紧密排列的样子;第三幅图是针对尺度和纵横比,改变之后的卷积核,类似与空洞卷积;第四幅图是针对图像旋转的卷积核;而第二幅是作者提出的,针对任意的图像改变,网络会学习到卷积核的一个偏移量,使网络可以适应目标不同的变化。
在这里插入图片描述

Deformable Conv
在这里插入图片描述
w ( p n ) w (p_n) w(pn)是网络学习的参数(权重),即卷积核; x ( p 0 + p n ) x(p_0+p_n) x(p0+pn)是像素 p 0 + p n p_0+p_n p0+pn的像素值,如下图,我们使用 3 × 3 3×3 3×3的卷积核, p n p_n pn p 0 p_0 p0附近的8个坐标。

Δ p n Δp_n Δpn是基于经典卷积的偏移量,是需要输入数据通过网络学习而得的。
在这里插入图片描述

Deformable ROI pooling

看这个之前需要先了解一下Fast RCNN的ROI pooling,大致就是将ROI映射后的特征图分成几个小窗口,然后对每个小窗口做max pooling。可以看下我的Fast RCNN论文解读
在这里插入图片描述
Fast RCNN取得是max pooling,而本文中是取得mean pooling。这里也是通过学习它的偏移量,使ROI映射的小窗口更接近于真实的目标。

3、实例

Deformable Conv

这里每个图像针对采样位置(其中一个小绿点),使用3个激活单元(b图是显示的2个激活单元),采用 3 × 3 3×3 3×3的deformable卷积核,所以 ( 3 × 3 ) 3 = 729 (3×3)^3=729 3×33=729个小红点。

下图中左侧是分布的背景,中间是小目标分布,右图是大目标分布。
在这里插入图片描述
Deformable ROI pooling

这里将ROI映射分成 3 × 3 = 9 3×3=9 3×3=9个小窗口,图中可以很容易理解,这9个小窗口都更偏向于目标。
在这里插入图片描述

  • 7
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小吕同学吖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值