简要介绍一下目标检测的网络
(1)R-CNN的原理:先用框把物体找出来,然后将找出来的框放入CNN中进行分类,这就是RCNN的简单原理。
(2)SPP-net:直接输入整张图片,所有区域共享卷积计算。解决了R-CNN中每张图片都要提取的区域(selective search算法会提取2000个区域)都要进行卷积计算,计算量太大。引入了空间金字塔池化,为不同尺寸的区域,直接在conv5上输出提取特征,映射到固定尺寸的全连接层上。但是引入了一个新的问题,SPP层之前的所有卷积层不能进行fine-tuning,因为引入了SPP(空间金字塔池化),导致梯度回传困难。
(3) fast-rcnn:在spp-net的基础上, 引入了两个新技术,感兴趣区域池化层(ROI)和多任务损失函数,实现了end—to-end, 所有层都可以fine-tuning
(4)
区域推荐中不用selective search算法了,而是用RPN