刚刚同事给我讲fasterRCNN的训练,赶紧记下来;
这同事自己调试出来的这些参数,流弊!!!下载地址:http://download.csdn.net/detail/ture_dream/9678542
上面太小,下载可以对应看
他说:conv5后的图片512维,36*60=2160个点,这是卷积后的特征图,每个点 对应的原图是 16*16 大小的图像块,为什么?600/36=16 982/60=16!!!!!
在16*16的图上采用RPN的anchor点,3*3=9锚点,每个锚点对应一个proposal窗口,2160个点对应36*60*9=19440个窗口
每个窗口对应2个得分和4个位置,9个喵对应18个rpn_cls_score和36个rpn_bbox_pred,所以RPN的rpn_cls_score和rpn_bbox_pred浮点运算分别为
:36*60*18*256=9 953 280 36*60*36*18=1 399 680 (此处应该同事算错了,公式见博客:http://blog.csdn.net/ture_dream/article/details/53186106)
他说36*60*9=19440个窗口根据得分选取前300个,channel变成5是一个score和4个位置点,宽高1 1 没解释清楚,有人知道吗?
下面为么是300 8 2 他也没简答,待研究》》》》》