faster_rcnn学习

weixin_44940947

已于 2022-04-11 17:31:32 修改

阅读量162

点赞数

分类专栏：深度学习文章标签：学习深度学习人工智能

于 2022-03-17 22:40:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44940947/article/details/123556595

版权

深度学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

RPN具体详解：

右边是RPN的结构，使用滑动窗口在特征图上滑动，每滑动到一个位置上，会生成1个一维的向量，（256_d 是 backbone的输出通道数(此处所用网络ZF，若用VGG16，就变成512-d)），在此向量上，分别通过两个全连接层，目标概率(cls layer)和边界框回归参数。

2k是针对k个anchor box,是针对每个anchor生成的2个概率，一个是背景的概率，一个是前景的概率，针对每个anchor都会生成4个边界框回归参数。

anchor是怎样生成的嫩？

首先找出特征图上对应在原图上的点，如何find？将原图的X/特征图的x=stride1，同理原图Y/y=stride2，eg：特征图上那个黑的方块x=3,y=3,映射回原图上X=x*stride1，同理，Y=y*stride2,

之后将映射回到原图上的点为中心，画出k个anchor box.

有关2k,4k的使用：

cls 2个一组，第一组：背景概率|前景概率=0.1|0.9

reg 4个一组对应生成的预测框的中心点坐标及长宽

关于3*3滑动窗口在特征图上感受野的问题：

anchor面积共有三种，对应长宽比也有3种，如右图圆圈，对应anchor面积128*128，有三种形状的的anchor. 而当使用VGG时，它的感受野只有228，那当anchor面积512*512时，他怎么预测呢？论文指出当人眼看到物体一部分时，也能识别物体，这里就是这个道理。

（补充：感受野定义及计算：

感受野：CNN每一层输出的特征图上的像素点映射回原始图像上的图像大小。

损失计算：

RPN损失=分类损失+边界框回归损失

分类损失：使用二值交叉熵损失，对每个anchor对应的cls计算损失（不是按一组组计算喔）

zuuz

边界框回归损失：

Fast损失=分类损失+边界框回归损失

由上图可见，分类损失也是采用多类别交叉熵损失的。

存在问题：

1.对小目标检测不友好

只是在一个特征层上进行预测的，而此特征层经过多重卷积，featuremap被抽象到一个比较高的层次，细节信息丢失了很多，而小目标检测正需要比较多的细节信息。

2.模型大，检测速度慢

two-stage检测网络通病

weixin_44940947

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

weixin_44940947 CSDN认证博客专家 CSDN认证企业博客

码龄5年

10: 原创

127万+: 周排名

95万+: 总排名

4586: 访问

: 等级

90: 积分

6: 粉丝

8: 获赞

3: 评论

20: 收藏

私信

关注

热门文章

分类专栏

最新评论

pptx转pdf 代码实现
CSDN-Ada助手: “恭喜作者第十篇博客的发布！能够将pptx转为pdf的代码实现确实是一个实用且有趣的主题。希望作者在以后的创作中能够继续保持这样的创新精神，也期待能够看到更多关于代码实现的分享。或许可以考虑分享一些关于编程技巧或者实用工具的文章，对读者来说会更加有帮助。期待作者的下一篇作品！”
轻量化网络之知识蒸馏
CSDN-Ada助手: 恭喜您写下了第9篇博客！标题“轻量化网络之知识蒸馏”非常吸引人，引发了我的浓厚兴趣。您在这篇博客中一定详细介绍了轻量化网络的知识蒸馏方法，让读者们能够更好地理解和应用这一技术。在接下来的创作中，我建议您可以进一步探讨知识蒸馏方法的实际应用场景，或者分享一些案例研究，让读者们更加深入地了解轻量化网络的实际效果和局限性。同时，您也可以考虑与读者互动，鼓励他们提问并回答他们的疑惑，以增加读者的参与感和互动性。谦虚而详尽的方式让读者更容易接受和理解您的观点，希望您能够继续保持这种写作风格，并在未来的创作中不断进步。期待您更多精彩的博客！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。