PyTorch深度学习实战(20)——从零开始实现Fast R-CNN目标检测
0. 前言
R-CNN 的主要缺点之一是生成预测结果需要较长时间,生成图像区域提议、调整区域尺寸以及提取与每个区域对应的特征是 R-CNN
目标检测模型的性能瓶颈。为了解决该问题,对 R-CNN
改进和优化后提出了 Fast R-CNN
算法,通过引入 RoI
(Region of Interest
) 池化层来极大地提高了检测速度和准确性,将整个图像输入到预训练模型以提取特征,并获取与原始图像的区域提议相对应的特征区域。在本节中,我们将介绍 Fast R-CNN
的工作原理,然后在自定义数据集上训练 Fast R-CNN
目标检测模型。
1. Fast R-CNN
1.1 模型架构
Fast R-CNN
是一种用于目标检测的深度学习模型,相比于传统的 R-CNN
模型的训练速度快 9
倍、测试时速度快 213
倍,通过下图可以了解 Fast R-CNN
原理