一、Fastrcnn里的anchor是啥
https://blog.csdn.net/as472780551/article/details/81227408
所谓anchor,就是特征图上的点预测的大小和长宽比例不同的K个框,这些框以该点对应到原图上的坐标点为中心。在Fastrcnn中,一个点预测9个框(9个anchor),这9个框的大小和比例都是事先设定好的。
二、Fastrcnn的输出层
51x39x256的特征图,每个点用一个3x3的卷积滑动。生成51x39x(9*4)和51x39x(9*2)的两个特征图,(9*4)和(9*2)就分别用来预测该点的anchor框与GT框的平移缩放值和前景背景概率。(与IOU最大的那个GT)
三、YOLO V1输出层:
7x7x30,表示SxSx(B∗5+C) = 7x7x(2*5 + 20)。
SxS表示网格数量,B表示每个点预测框的个数,C表示能检