1 Faster RCNN
2 RPN 网络
注意的点
(1)两次reshape的作用
将(n,18,37,50)改为(n,2,37*9,50),然后做softmax(intput,1),dim=1,第一维是batch,对第二维进行softmax,如图,这样两两一组,能把每一个特征点都分成前景与背景。在这之后,再把维度改回去。
3 真值生成
(1)计算偏移量
假设Anchor A的中心坐标为xa与ya,宽高分别为wa与ha, 标签M的中心坐标为x与y,宽高分别为w与h,则对应的偏移真值计算公式如式下所示。
位置偏移tx与ty利用宽与高进行了归一化, 而宽高偏移tw与th进行了对数处理, 这样的好处是进一步限制了偏移量的范围,便于预测。