R-CNN
1.使用启发式搜索算法来选择锚框
2.使用预训练模型来对每个锚框抽取特征
3.训练一个SVM来对类别分类
4.训练一个线性回归模型来预测边缘框偏移
兴趣区域Rol池化层
1.给定一个锚框,均匀分割成nXm块,输出每块里的最大值
2.不管锚框多大,总是输出nm值
Fast RCNN
1.使用CNN对图片抽取特征
2.使用Rol池化层对每个锚框生成固定长度特征
Faster R-CNN
使用一个区域提议网络来替代启发式搜索来获得更好的锚框,常用于高精度场景
Mask R-CNN
如果有像素级别的标号,使用FCN来利用这些信息,提升CNN性能,常用于高精度场景
SSD单发多框检测
1.一个基础网络来抽取特征,如何多个卷积层块来减半高宽
2.在每段都生成锚框,在底部段来拟合小物体,顶部段来拟合大物体
3.对每个锚框预测类别和边缘框
4.SSD通过单神经网络来检测模型,以每个像素为中心的产生多个锚框,在多个段的输出上进行多尺度检验
YOLO
YOLO将图片均匀分成SXS个锚框,每个锚框预测B个边缘框,后续版本有持续改进。