D7-DCN解读

最新推荐文章于 2024-07-21 17:17:02 发布

小吕同学吖

最新推荐文章于 2024-07-21 17:17:02 发布

阅读量1.2w

点赞数 7

分类专栏：深度学习 # 目标检测文章标签：目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/l2181265/article/details/100161050

版权

深度学习同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

9 篇文章 1 订阅

订阅专栏

DCN

DCN论文的贡献是提出Deformable Conv。

论文创新：
1、Deformable Conv
2、Deformable ROI pooling

1、背景

深度学习对图像处理往往需要大量的数据集训练，是因为我们需要让网络学习到所有可能存在的情况，所以我们采用了数据增强的方法，如旋转、左右移、上下移、裁剪等操作。

但是针对图像目标尺度、姿态、角度、局部的变形等情况，基于经典卷积固定的几何结构，我们并不能完全模拟出来。
在这里插入图片描述

2、方法

于是，作者提出Deformable，对于3×3卷积核，经典卷积是第一幅图那样简单，紧密排列的样子；第三幅图是针对尺度和纵横比，改变之后的卷积核，类似与空洞卷积；第四幅图是针对图像旋转的卷积核；而第二幅是作者提出的，针对任意的图像改变，网络会学习到卷积核的一个偏移量，使网络可以适应目标不同的变化。
在这里插入图片描述

Deformable Conv
在这里插入图片描述
$w (p_n)$ 是网络学习的参数（权重），即卷积核； $x(p_0+p_n)$ 是像素 $p_0+p_n$ 的像素值，如下图，我们使用 $3 \times 3$ 的卷积核， $p_n$ 是 $p_0$ 附近的8个坐标。

$Δp_n$ 是基于经典卷积的偏移量，是需要输入数据通过网络学习而得的。
在这里插入图片描述

Deformable ROI pooling

看这个之前需要先了解一下Fast RCNN的ROI pooling，大致就是将ROI映射后的特征图分成几个小窗口，然后对每个小窗口做max pooling。可以看下我的Fast RCNN论文解读
在这里插入图片描述
Fast RCNN取得是max pooling，而本文中是取得mean pooling。这里也是通过学习它的偏移量，使ROI映射的小窗口更接近于真实的目标。

3、实例

Deformable Conv

这里每个图像针对采样位置（其中一个小绿点），使用3个激活单元（b图是显示的2个激活单元），采用 $3 \times 3$ 的deformable卷积核，所以 $3×3）^3=729$ 个小红点。

下图中左侧是分布的背景，中间是小目标分布，右图是大目标分布。
在这里插入图片描述
Deformable ROI pooling

这里将ROI映射分成 $3 \times 3 = 9$ 个小窗口，图中可以很容易理解，这9个小窗口都更偏向于目标。
在这里插入图片描述

小吕同学吖

关注

7
点赞
踩
38

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

小吕同学吖 CSDN认证博客专家 CSDN认证企业博客

码龄6年

86: 原创

5万+: 周排名

2万+: 总排名

31万+: 访问

: 等级

2712: 积分

100: 粉丝

186: 获赞

76: 评论

718: 收藏

私信

关注

热门文章

分类专栏

随笔 13篇
医学图像 6篇
nnUNet 3篇
图像分割 3篇
算法 2篇
爬虫 1篇
笔记 50篇
QT 2篇
matlab 2篇
ubuntu 6篇
人脸识别 1篇
图像处理 6篇
计算机视觉 5篇
机器学习 2篇
神经网络 2篇
深度学习 12篇
图像分类 2篇
语义分割 12篇
目标检测 9篇
超分辨率 1篇
pytorch 6篇
tensorflow 5篇

最新评论

N随手小记
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
N随手小记
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Edge浏览器打不开任何网页！！！
weixin_53123112: 新建DWORD(32位)，将名称改为RendererCodeIntegrityEnabled，值为0
c++测试pytorch训练的模型
眼前荒芜°: 您好，我在pathon中将.pth文件转成.onnx文件后，在vs2017中导入.onnx文件时： dnn::Net net = cv::dnn::readNetFromONNX(modelFile);一直会报错，也不知道是什么错误？您有遇到过吗？
PSNR&SSIM&VIF指标-python版本
陈嘿萌: 计算 psnr 虽然有的是用 255 来除以 mse，但是一般是 max_piex(image)来除以 mse，当然都有平方。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小吕同学吖 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。