Faster-RCNN anchor box Pytorch 锚点生成（含代码）

最新推荐文章于 2025-02-20 23:18:04 发布

史蒂芬方

最新推荐文章于 2025-02-20 23:18:04 发布

阅读量4.5k

点赞数 1

分类专栏： Faster - RCNN 学习 Deeplearning 文章标签： rcnn 目标检测 yo'lo anchorbox DL

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44638957/article/details/94902435

版权

学习同时被 3 个专栏收录

18 篇文章

订阅专栏

12 篇文章

订阅专栏

5 篇文章

订阅专栏

本文深入解析FasterRCNN中锚框(anchorbox)的生成机制，介绍如何通过中心点计算锚框坐标，利用不同比例和缩放比创建锚框组，以及如何遍历图像确保目标检测无死角。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Faster RCNN 的anchor box 是如何生成的？

简单科普一下
anchor box 在Faster RCNN 中就是像以下这样的框框
可以分成3种长宽比(0.5, 1, 2)，3种缩放比(8, 16, 32) 以这样的配置来组合成一组anchor框组
一组就是3x3(也就是9个)个anchor box所组成
在这里插入图片描述
那么这9个anchor box是如何画在图像上的呢？
可以透过自定义的px, py 中心点来计算出anchor的左下角以及右上角坐标点(x, y)

算出九个anchor box，依照一开始所设置的比例，将点连成四边形就会出现这样，我一直觉得很像方形玫瑰花，聪明的你肯定可以看出四方形的长与宽就是我们设置的比例以及缩放比
在这里插入图片描述
那么我们接下来要思考个问题，既然已经设计出了anchor box的形状及一组个数，我们该如何让这些框遍布整副图像才不会错过任何目标物呢？

我们刚刚已经知道利用中心点就可以算出九个框框的坐标并连成四方形
这次一样用anchor box的中心点来延伸！

记住这一次我们要让中心点遍布整个图像

定义16为stride，也就是每16个像素为步长设立一个点
那么一副600*1000像素的输入图像

上面能摆多少个中心点呢？
很简单 600/16 x 1000/16 = 38 x 63 一共2394个中心点

我们就是要用这2394个中心点延伸出来
延伸的方式略有不同，这里除了用到矩阵相乘还有transpose, reshape等（详情要看代码会更明了)

所有最终一个点延伸出9个anchor box, 那么2394个点就会有21546个anchor box
这2万多个边框遍布在图像会是什么体验？

就是无死角的遍布！！！！
在这里插入图片描述

其实侧边的中心点延伸之后anchor box肯定是会超出图像边界的，如果把图在向外扩展的话，就是像下面图这个样子，那么超出的部分肯定是用不上的，在faster rcnn中也有将超出的部分排除的相关代码，所以最终的目标肯定还是在图像范围内

在这里插入图片描述

讲到这应该对anchor box的生成会更有体悟了吧
接下来就自己实践一次就能更清楚明白了

代码放在博客真的很冗长，我个人是很不喜欢看太长的博文，喜欢直接看重点
想自己手敲一次的还是去github download 代码更完整一点
每一行几乎都有注释，可能有点乱哈但希望尽量写清楚看明白

最后附上代码教学, issue欢迎提交

Github链接

faster-rcnn-anchor-box 代码实现教学

主要源码来自chenyuntc大神

simple-faster-rcnn

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。