具体参数可以查看:https://www.cnblogs.com/wangyong/p/8513563.html
RPN流程:
1.每一张图片生成固定数量的锚节点,锚节点个数是最后一次特征图大小,比如说最后一层特征大小为(37,50),所以有37*50个锚节点.锚节点之间的步长为16像素点,这是因为vgg16有4次maxpool,所有图像缩小了16倍,所以步长为16像素。每一个锚节点又生成9个区域图,所以生成的锚节点区域图就有9*37*50个.
2.如图1左,通过卷积特征生成2*锚节点个数(通道数)scores和4**锚节点个数(通道数)坐标;这里坐标是相对对应锚节点的偏差量。
这个预测值将与真值标签计算损失;这里真值标签的制作为真值标签与锚节点重叠度最大的作为真值,计算偏差量,与预测值获得的偏差量进行计算。
由于锚节点框数量太多,所以是又进行筛选进行计算的:
① 去除掉超过1000*600这原图的边界的anchor box
② 如果anchor box与ground truth的IoU值最大,标记为正样本,label=1