fastrcnn、yolo输出层的比较，以及anchor是啥

最新推荐文章于 2024-07-22 12:27:09 发布

china026

最新推荐文章于 2024-07-22 12:27:09 发布

阅读量2.1k

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/china026/article/details/87996123

版权

本文详细对比了Fastrcnn和YOLO系列模型（V1、V2、V3）中关于Anchor的概念以及输出层的设计。在Fastrcnn中，每个特征点预测9个Anchor框；而YOLO则通过不同尺度的特征图预测目标，V1使用7x7网格，V2引入5种Anchor并预测框的相对偏移量，V3扩展为3个尺度覆盖9个Anchor。

摘要由CSDN通过智能技术生成

一、Fastrcnn里的anchor是啥

https://blog.csdn.net/as472780551/article/details/81227408

所谓anchor，就是特征图上的点预测的大小和长宽比例不同的K个框，这些框以该点对应到原图上的坐标点为中心。在Fastrcnn中，一个点预测9个框（9个anchor），这9个框的大小和比例都是事先设定好的。

二、Fastrcnn的输出层

51x39x256的特征图，每个点用一个3x3的卷积滑动。生成51x39x（9*4）和51x39x（9*2）的两个特征图，（9*4）和（9*2）就分别用来预测该点的anchor框与GT框的平移缩放值和前景背景概率。（与IOU最大的那个GT）

三、YOLO V1输出层：

7x7x30，表示SxSx(B∗5+C) = 7x7x(2*5 + 20)。

SxS表示网格数量，B表示每个点预测框的个数，C表示能检

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。