G-CNN an Iterative Grid Based Object Detector 论文笔记

最新推荐文章于 2022-06-06 19:59:46 发布

五十岁的少女

最新推荐文章于 2022-06-06 19:59:46 发布

阅读量239

点赞数

分类专栏：论文笔记_目标检测文章标签：深度学习神经网络计算机视觉 cnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40253737/article/details/119280029

版权

论文笔记_目标检测专栏收录该内容

17 篇文章 0 订阅

订阅专栏

background

任务：取消建议区域的算法，减少盒子的数量，加快速度
关键词：G-CNN

Introduction

这是一篇2016年的论文，主要对标fast rcnn，以fast rcnn为例子，需要通过建议，提供上千个建议区域，十分影响检测的速度，而且positive和negative，hard，easy，也会影响模型的准确率。

所以本文作者删除了提案阶段，和减少处理box的数量来提高检测速度。

作者认为，将检测区域的生成，看作是一种寻找过程，初始化的区域需要通过复杂的非线性变化，得到最后的目标区域，所以作者通过一种迭代过程，将初始的区域，通过次次迭代，不断平移，得到最后的结果。

在这里插入图片描述

Model

整体结构

在这里插入图片描述

主要的G-CNN Network Structure与fast rcnn类似，不过去掉了建议生成网络。

基本过程

伪代码
在这里插入图片描述

首先是初始化区域（提出一些区域便于后面的变形）

然后通过与各个ground-truth比较，选择最大的iou对应的ground-truth作为目标。

在这里插入图片描述

在这里插入图片描述

$B_{i}^{1}$ 为第一次迭代时的第i个box对应的向量
$B_{i}^{s}$ 中s为第s次迭代，其中 $1<=s<=S_{train}$

目标梯度下更新后的B：

在这里插入图片描述

其中 $G_{i}^{*}$ 为 $B_{i}^{1}$ 对应的ground-truth
$\Delta(B_{i}^{s},T_{i}^{s})$ 表示偏移量， $T_{i}^{s}$ 为（2）中的输出值

$\delta_{i,l_i}^{s}$ 表示预测的偏移量， $l_i$ 为第i个box的种类

最后的损失函数：
在这里插入图片描述

其中 $I (.)$ 为1或0， $B_{i}^{l}$ 是背景则为0否则为1
实际的更新策略：

其中， $\Delta^{-1}$ 将定义的参数化空间中位置和尺度的相对变化向后投影到B中
但是需要在训练过程中对网络的前向路径进行评估，导致训练效率低下，所以假设完全学好，得到： $B_{i}^{s}=T_{i}^{s}$

TEST

在这里插入图片描述

预测时，只是将ROL INFO之后的进行迭代循环，增加速率
伪代码

在这里插入图片描述

Experiment

训练时，主要初始化180个网格S=3

在这里插入图片描述

性能和之前的网络不相上下，但速率更快

在这里插入图片描述

Learn from paper

作者认为从初始化区域到目标区域是一个复杂的非线性变化，但是通过迭代更新，感觉训练效率有点低，训练时迭代的话可以构建一个局部神经网络来模拟非线性变化，没必要全部迭代。

通过取消建议区域，还是很创新的，感觉迭代算法没什么必要，有更好的代替算法。

五十岁的少女

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
G-CNN an Iterative Grid Based Object Detector 论文笔记

background任务：取消建议区域的算法，减少盒子的数量，加快速度关键词：G-CNNIntroduction这是一篇2016年的论文，主要对标fast rcnn，以fast rcnn为例子，需要通过建议，提供上千个建议区域，十分影响检测的速度，而且positive和negative，hard，easy，也会影响模型的准确率。所以本文作者删除了提案阶段，和减少处理box的数量来提高检测速度。作者认为，将检测区域的生成，看作是一种寻找过程，初始化的区域需要通过复杂的非线性变化，得到最.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。