Taking a Deeper Look at Pedestrians

最新推荐文章于 2023-05-24 17:12:45 发布

VIP文章小菜鸡拉

最新推荐文章于 2023-05-24 17:12:45 发布

阅读量881

点赞数

分类专栏：行人检测文章标签：深度学习

本文链接：https://blog.csdn.net/xiaofei0801/article/details/72800977

版权

1. Introduction

近年来，计算机视觉领域涉及卷积神经网络（convnets）的成功案例爆炸式增长。这种架构目前提供了通用物体分类[25,36]，通用物体检测[40]，特征匹配[16]，立体匹配[45]，场景识别[48,8]，姿态估计[41,7] ，行为识别[23,38]和许多其他任务[35,3]的最好结果。行人检测是汽车安全，视频监控和机器人等相关应用中物体检测的典型案例。已经为这个问题探索了一系列不同的想法[13,18,22,5]，并建立了benchmark数据集[12,17]。我们想知道是否可以将convnets成功迁移到行人检测任务。

以前用于行人检测的神经网络的工作依赖于special-purpose design（不懂），例如，hand-crafted feature，part and occlusion 建模。虽然这些提出的方法执行得很好，但目前的最好方法都是基于通过Adaboost学习的决策树[5,47,34,28,44]。在本文中，我们重新审视了这个问题，并表明小型和大型vanilla convnets可以在具有挑战性的Caltech行人数据集上达到最好表现。我们还提供了关于训练细节，网络参数和不同的提案方法等的广泛实验。

1.1. Related work

尽管行人检测任务非常热门，只有少数工作已经应用深层神经网络来实现这一任务：我们只知道6个。
第一篇使用convnets用于行人检测的文章[37]重点介绍如何处理有限的训练数据（他们使用INRIA数据集，其中提供614个正面图像和1218个负面图像进行训练）。首先，使用卷积稀疏编码的形式对每个层进行初始化，随后对整个网络进行微调，用于检测任务。他们提出了一种使用最后一层和倒数第二层的特征进行检测的体系结构。该方法名为ConvNet [37]。
另一个工作线将可形变部件模型（DPM）[15]与训练用于解决部件和遮挡建模（DBN-Isol）的层叠限制玻尔兹曼机（RBM）[30]。这个模型被扩展到考虑到person-to-person relations（DBN-Mut）[32]，最后共同优化所有这些方面：JointDeep [31]共同优化特征，部件形变，遮挡和person-to-person relations。

最低0.47元/天解锁文章

小菜鸡拉

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Taking a Deeper Look at Pedestrians

1. Introduction 近年来，计算机视觉领域涉及卷积神经网络（convnets）的成功案例爆炸式增长。这种架构目前提供了通用物体分类[25,36]，通用物体检测[40]，特征匹配[16]，立体匹配[45]，场景识别[48,8]，姿态估计[41,7] ，行为识别[23,38]和许多其他任务[35,3]的最好结果。行人检测是汽车安全，视频监控和机器人等相关应用中物体检测的典型案
复制链接

扫一扫