Faset RCNN (学习笔记一)
学习一个模型一定一定要从两方面入手:
测试(Test)
首先理清测试逻辑,即模型已经训练好了,扔进去一张图片,是如何一步步生成带有检测框和置信度的检测结果的。
训练(Train)
然后再看训练过程,检测和训练过程通常架构都是一样的,训练主要是加入了LOSS来学习各个地方的参数,所以这步主要就是搞清LOSS是如何运作的。
1.conv layers 特征提取网络 得到feature maps 用于后面的RPN层和取proposal
2.RPN 区域候选网络 用于生成候选框 。两个部分,一个是anchor bool值 二分类用来检测anchor种是否有目标,还有一个 bounding box regression 用来修正使得得到较为准确的检测框。
3.Rol Pooling
精髓在于有一个预处理的思想
这和跳连块有异曲同工指标f(x)=wg(x)+vh(x)
如果w和参数v,也就是说预处理只会增加好的效率,而不会降低效率