RFCN 论文要点与PyTorch实现


最近研究一个文本检测网络时,用到了RFCN,但是发现pytorch版本没有简洁的实现版本,故复现论文并开源在github上:
项目链接

结构分析

在这里插入图片描述

RFCN以ResNet101为backbone,从layer3输出的特征用于训练RPN; layer4中的步长被更改为stride=1, 使用空洞卷积替换,整个resnet101的下采样倍数为16x,输出特征用于训练PsRoI Head.

PsRoI 与 RoI 相似,只是不同位置的感兴趣区域的特征分别从不同输入通道上获取,使用cuda实现时主要将输入特征索引匹配好。

在这里插入图片描述

PyTorch实现

Pytorch实现主要把握PsRoI的cuda实现,注:实验发现PyTorch自带的PsROI模块输入和反传结果与MxNet不一致,mAP也低了约5个点,也没有group_size选项,故使用了自己写的PsROI模块。

将RPN和PsROI Head 进行联合训练

  • 在voc2007上训练,使用OHEM,在voc2007上测试mAP可达72.5%(论文为voc07+12训练)
  • 在voc07+12训练还可提升近5个点

==>项目指路:
https://github.com/elbert-xiao/Simple-RFCN-PyTorch

该项目完全基于PyTorch实现,内存占用非常小(训练时约为3GB),效果还不错。欢迎查看交流,star or fork . ^_^
在这里插入图片描述

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 11
    评论
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值