以下先简单介绍rpn,不过还来不及看代码呢,以后补充上。
1.1目的——输入为image,输出为一堆目标候选区域
1.2网络架构——一个网络在basemodel的最后一个featuremap上滑动。每个滑动窗口映射为256维的特征向量
1.3anchor——在每一个滑动窗口位置,同时生成k个候选区域。每一个anchor关联一个面积和一个ratio。
1.4tanchor的标注——正样本:(1)一个GT对应的最大iou的anchor(2)与任何一个anchor的IOU大于0.7;
负样本:与所有的GT的IOU小于0.3