深度学习目标检测算法性能分析

参考如下论文2017年最新版:
Speed/accuracy trade-offs for modern convolutional object detectors

Background

本文的目的就是在给定设备与平台的前提下,帮助选择一个合适的检测框架,能够实现速度、准确度、内存的多方面平衡。

Google Research搭建了三种通用检测框架:Faster R-CNN, R-FCN and SSD,

近几年目标检测领域突飞猛进,Faster R-CNN, R-FCN, Multibox, SSD and YOLO等检测算法都足够好,可以放在实际应用中。
可是实践者还是很难决定到底在什么时候取用哪种框架比较合适。
mAP不能告诉你所有的事情。

Meta-architectures基础架构

受分类网络启发,从RCNN到Fast-RCNN,再到后来的Faster-RCNN。这里RCNN到Fast-RCNN都是在神经网络之外提取的候选区域,Faster-RCNN则是在神经网络内部提取的候选区域。
这些工作中比较典型的,就是图像上的一系列不同的空间位置、不同尺度、不同的长宽比例的盒子,来充当“anchor”、“default boxes”“priors”。
于是一个训练模型在一个锚点需要预测两种信息:
(1)为每一个锚点预测一个类别;
(2)为每一个锚点预测x与y方向的偏移量,来确定bounding box;
这个anchor策略使得目标检测的精度与计算量都得到了很大程度的优化。
例如在multibox中,这些anchors是通过对groundtruth中的bounding box聚类得到;
在这篇文章中,主要研究三种基础架构:Faster R-CNN, R-FCN and SSD
为了更科学地对比,将meta-architecture 从 feature extractor中剥离出来。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值