这篇文章的主要工作是把物体检测问题重新看成回归问题来求解,利用单个神经网络完成整幅图像上bbox和类别概率的估计。提高了物体检测的速度。
神经网络与目标检测
- RCNN: 由于深度学习在目标检测领域效果差强人意,rbg把检测问题转变为分类问题。按照region proposal+features+classifiers的框架,先选择感兴趣的区域,再提取CNN特征,最后用SVM分类。但是每个proposal都要提取CNN特征,所以速度很慢。
- Fast RCNN: 借鉴了SPP net,对整张图提取CNN特征,然后在roi layer把proposal对应到特征图上。
- Faster RCNN: 提出了rpn来得到proposal.
- YOLO: 不使用region proposal。