1.FPN结构
以Resnet50为例:
bottom-up通过下采样,以因子为2采样。
top-down通过上采样,以因子为2采样。以临近插值算法。
Ci层通过1*1卷积调整channel和Ci层channel一样,再通过3*3卷积得到P2,P3,P4,P5。
注意:P6是P5通过最大池化1*1*256,stride=2采样得到的
P2,P3,P4,P5,P6通过RPN结构,但是P2,P3,P4,P5通过Fast R-CNN,P6不通过的
proposal通过P2,P3,P4,P5,P6投影在P2,P3,P4,P5
越是底层细节信息多,所以areas越小,越是上层,语义信息多,越大。
注意:不同的proposal是如何投影的 对应的映射特征层呢?
k0=P的数量,以上图为例,k0=4(p6不算)
wh为proposal在原图的宽*高,以w*h=112*112.
k=int(4-1)=3,投影到p3.