基于DNN的目标检测Deep Neural Networks for Object Detection

最新推荐文章于 2023-06-24 20:20:48 发布

LzLedu

最新推荐文章于 2023-06-24 20:20:48 发布

阅读量1.1k

点赞数 1

分类专栏：目标检测论文阅读

本文链接：https://blog.csdn.net/LzLedu/article/details/89508920

版权

本文探讨2013年一篇论文，介绍如何使用深度神经网络（DNN）进行目标检测，将目标检测视为回归问题，通过DNN回归目标窗口的Bounding Box位置。为提高定位精度，提出生成多个Masks并进行多尺度细化的方法。模型设计包含7层，其中5层卷积，最后两层全连接，用于生成目标的二进制掩码框。

摘要由CSDN通过智能技术生成

论文地址：http://papers.nips.cc/paper/5207-deep-neural-networks-for-object-detection.pdf

1.简述

文章发表于2013年，在当时cnn对目标边界框的定位表现还不是很好，当时对目标检测的主流算法之一是the deformable part-based model，这种方法由在star model里一系列分别的训练部分组成，它由两层模型组成，第一层为划分组件，第二部分为星形模型。这种算法的弱点为模型组件是基于人工设计的hog(histogram of Gradients ),而且组件的结构基于运动学动机。这种方法称为组件模型，用于检测的组件模型是基于像primitives ， focus on shape ， use Gabor filters ，larger HOG filters 这种分割方式，这些方法存在训练比较困难，需要对所学习的程序进行特殊设计以及Inference time需要结合Bottom-up 和 Top-down过程。

作者在本文提出了用DNN来做目标检测（目标检测 = 目标识别 +目标定位），把目标检测当做回归的问题，即回归目标窗口Bounding Box的位置。主要解决的问题是用有限的计算资源，在一张图片上寻找大量的多尺度的潜在目标实例。