学习笔记十三——R-FCN

最新推荐文章于 2023-12-11 17:58:59 发布

Shl_1024

最新推荐文章于 2023-12-11 17:58:59 发布

阅读量358

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Shl_1024/article/details/103837231

版权

本文深入探讨了R-FCN（Region-based Fully Convolutional Networks）在目标检测中的应用。针对传统网络结构中目标检测精度与运行速度的矛盾，R-FCN引入位置敏感的分数图和RoI池化层，通过全卷积网络实现高效检测。论文以ResNet-101为基础，去除全连接层，利用1×1卷积降低维度，并将RoI划分为k×k网格，为每个类别生成分数图。R-FCN的损失函数结合分类和回归任务，实现在保持高精度的同时提高运行效率。

摘要由CSDN通过智能技术生成

论文R-FCN:Object Detection via Region-based Fully Convolutional Networks学习总结

提出问题：在使用AlexNet和VGG Nets网络时，由于其在设计上由两个子网络组成：一个卷积子网络以空间池化层结束，后面是几个全连接层。因此，在目标检测网络中自然地通过感兴趣区域RoI池化层进行划分，划分为两个子网络：（1）独立于RoI的共享“全卷积”子网络，（2）不共享计算的RoI子网络。

但是随着神经网络的发展，提出了ResNet和GoogLeNets是全卷积的。因此类比提出在目标检测架构中使用所有卷积层来构建共享的卷积子网络，使得RoI的子网络没有隐藏层。然而，这个解决方案检测精度很差。

作者提出这种不平衡是由于增加图像分类的变换不变性与目标检测的平移可变性而导致的困境。

解决方法：为了将平移可变性并入FCN，我们通过使用一组专门的卷积层作为FCN输出来构建一组位置敏感的分数图。在这个FCN之上，我们添加了一个位置敏感的RoI池化层，它从这些分数图中获取信息，并且后面没有权重（卷积/fc）层。

R-FCN详解：

主干结构：基于ResNet-101，删除最后的平均池化层和全连接层，保留前100卷积层，只使用卷积层来计算特征映射

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。