对A MultiPath Network for Object Detection论文的理解

最新推荐文章于 2024-04-10 18:02:30 发布

sunsssk1

最新推荐文章于 2024-04-10 18:02:30 发布

阅读量1.1k

点赞数 1

分类专栏：图像分割

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37124765/article/details/54906517

版权

图像分割专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本篇论文是facebook三篇论文之一，主要介绍multipathnet网络，下面是本人的一些总结。新手入坑，多多指教

multipathnet网络是利用deepmask网络和sharpmask网络产生的object proposals作为输入的一部分，对其进行分类。

这个网络是对Fast R-CNN的改进，改进的点主要有三个，先来看下这两个网络的网络结构

首先是fast r-cnn

再是本论文的multipathnet

三个改进点

(1)跳跃结构

在VGG网络里，从conv1到conv4，每层conv之后都有一次2*2的max pooling，4次max pooling之后，特征图将下采样到原先的1/16，这会导致信息的丢失。所以将具有丰富信息的较早层连接至后面的网络。

conv3-->1x，conv4-->1x，1.5x，2x，conv5-->1x，1.5x，2x，4x

(2)中心区域

背景信息对于小目标检测识别来说是很有用的，所以作者使用了4种不同大小的region crops，分别是1x，1.5x，2x和4x。

在每种情况下，使用RoI Pooling技术将它们固定到相同大小。送入全连接层。

四个输出连接成一个长向量，用于打分和框回归。

(3)积分损失函数

Fast R-CNN里所有IoU>50%的proposals的得分是相等的，作者改进了损失函数，设置6个不同大小的IoU，分别计算得分然后求平均。这样的话，IoU越高，得分就越高。

原先的积分损失函数

改进的积分损失函数

把求得的6个预测类概率求平均

作者设置n=6，u=[50,55,60,65,70,75].（IoU增大，正样本减少）

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。