AlignDet

最新推荐文章于 2024-07-20 17:12:48 发布

Blue_Whale2020

最新推荐文章于 2024-07-20 17:12:48 发布

阅读量904

点赞数 1

文章标签： python 计算机视觉

本文链接：https://blog.csdn.net/Blue_Whale2020/article/details/122499541

版权

AlignDet

具体论文链接，这里我只记录我自己看不懂的地方
AlignDet
😈😈😈

3.1

For a RetinaNet [16] detector with a P3 − P7 FPN backbone, the strides for different pyramid levels are {8, 16, 32, 64, 128}. When equipped with an anchor box of a scale factor of 4, this detector yields a set of anchor boxes of size {32^2, 64^2, 128^2, 256^2, 512^2}
有关这个的计算和FPN的结构见下图 ResNet50 + FPN 图片来自 bilibili

4.1

有关Locconv和 LocROI的算式(1)和(2)
（1）可以假设feature map = 8*8 ; X = 4 ;Y = 4 ; h = w= 3;那么 i=（0,1,2) ; j = (0,1,2) 这么演算一下就能整明结果是正确的
（2）先把第一项对应x坐标的位置分解为两部分，第一部分 part1= x1/s，part1对应了(1)中的X-h/2，因为x1是左上角点坐标，X是中心点坐标。剩下的部分就是part2 = （x2-x1）(i + 0.5)/ hs，忽略s,在x2-x1 = h 时，part2 = i + 0.5 ，于（1）相匹配。

再来说 S 的意思，因为（x1,y1,x2,y2)是原图上点的坐标，为了得到在feature map的结果，需要除当前feature map的stride。
产生这个区别的原因：RoIAlign是ROI的下一个步骤，具体见faster rcnn的步骤。

(3)之所以陈述这两个公式之间的关系，是为了证明不同尺度的conv也能起到RoIAlign的效果，进一步证明了为什么FPN这种技术在one-stage方法上能有效。

4.2

（4）的计算只使用了卷积核（位置和长宽）、当前featuremap的stride这两组变量，输入是当前anchor 和由当前anchor回归到的learned anchor ,输出是当前anchor中心点卷积的offset。
可以看下面的两篇回答
具体还是要看代码
zhihu
zhihu2

Blue_Whale2020

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
AlignDet

AlignDet具体论文链接，这里我只记录我自己看不懂的地方AlignDet????????????3.1For a RetinaNet [16] detector with a P3 − P7 FPN backbone, the strides for different pyramid levels are {8, 16, 32, 64, 128}. When equipped with an anchor box of a scale factor of 4, this detector y
复制链接

扫一扫