RFCN 论文要点与PyTorch实现

最新推荐文章于 2021-10-23 09:08:47 发布

功夫小象

最新推荐文章于 2021-10-23 09:08:47 发布

阅读量833

点赞数 2

分类专栏：论文笔记论文复现文章标签： pytorch 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34907927/article/details/113786173

版权

论文笔记同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

最近研究一个文本检测网络时，用到了RFCN，但是发现pytorch版本没有简洁的实现版本，故复现论文并开源在github上：
项目链接

结构分析

在这里插入图片描述

RFCN以ResNet101为backbone，从layer3输出的特征用于训练RPN; layer4中的步长被更改为stride=1, 使用空洞卷积替换，整个resnet101的下采样倍数为16x，输出特征用于训练PsRoI Head.

PsRoI 与 RoI 相似，只是不同位置的感兴趣区域的特征分别从不同输入通道上获取，使用cuda实现时主要将输入特征索引匹配好。

在这里插入图片描述

PyTorch实现

Pytorch实现主要把握PsRoI的cuda实现，注：实验发现PyTorch自带的PsROI模块输入和反传结果与MxNet不一致，mAP也低了约5个点，也没有group_size选项，故使用了自己写的PsROI模块。

将RPN和PsROI Head 进行联合训练

在voc2007上训练，使用OHEM，在voc2007上测试mAP可达72.5%（论文为voc07+12训练）
在voc07+12训练还可提升近5个点

==>项目指路：
https://github.com/elbert-xiao/Simple-RFCN-PyTorch

该项目完全基于PyTorch实现，内存占用非常小（训练时约为3GB）,效果还不错。欢迎查看交流，star or fork . ^_^
在这里插入图片描述

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
11
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 11

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。