AlignDet

AlignDet

具体论文链接,这里我只记录我自己看不懂的地方
AlignDet
😈😈😈

3.1

For a RetinaNet [16] detector with a P3 − P7 FPN backbone, the strides for different pyramid levels are {8, 16, 32, 64, 128}. When equipped with an anchor box of a scale factor of 4, this detector yields a set of anchor boxes of size {32^2, 64^2, 128^2, 256^2, 512^2}
有关这个的计算和FPN的结构见下图ResNet50 + FPN图片来自 bilibili

4.1

有关Locconv和 LocROI的算式(1)和(2)
(1) 可以假设feature map = 8*8 ; X = 4 ;Y = 4 ; h = w= 3;那么 i=(0,1,2) ; j = (0,1,2) 这么演算一下就能整明结果是正确的
(2) 先把第一项对应x坐标的位置分解为两部分,第一部分 part1= x1/s,part1对应了(1)中的X-h/2,因为x1是左上角点坐标,X是中心点坐标。 剩下的部分就是part2 = (x2-x1)(i + 0.5)/ hs,忽略s,在x2-x1 = h 时,part2 = i + 0.5 ,于(1)相匹配。

  • 再来说 S 的意思,因为(x1,y1,x2,y2)是原图上点的坐标,为了得到在feature map的结果,需要除当前feature map的stride。
  • 产生这个区别的原因:RoIAlign是ROI的下一个步骤,具体见faster rcnn的步骤。

(3)之所以陈述这两个公式之间的关系,是为了证明不同尺度的conv也能起到RoIAlign的效果,进一步证明了为什么FPN这种技术在one-stage方法上能有效。

4.2

(4)的计算只使用了卷积核(位置和长宽)、当前featuremap的stride这两组变量,输入是当前anchor 和由当前anchor回归到的learned anchor ,输出是当前anchor中心点卷积的offset。
可以看下面的两篇回答
具体还是要看代码
zhihu
zhihu2

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值