Faster RCNN的理解和资料收集

Faster RCNN的理解和资料收集

资源收集

知乎一文看懂Faster RCNN
Bilibili唐宇迪老师关于tensorflow下faster rcnn的论文解读和代码解析
Faster RCNN论文中英翻译

自己的理解

在这里插入图片描述
对于理解帮助比较大的是B站视频和这篇知乎文章。
Faster RCNN先用一个VGG的卷积网络来直接提取整张图片的特征(当然如图所示调节了尺寸),这对比RCNN来说已经省去了太多代价消耗,RCNN采用SS方法先去挑选上千个region proposal,然后每个region还单独搞一个CNN来提取特征,实在是慢爆了。
这个VGG卷积网络中有 卷积层、relu层和pooling层,因为在外圈填0(具体叫什么不记得了),所以卷积层不会缩放图片,relu也不会,只有pooling一次 才会将feature map长宽各缩小一半(应该一旦进入卷积网络,就不叫图片了,所以我这里就把中间的结果和最后的结果都叫做feature map),因为VGG有四个pooling层,所以最后的feature map尺寸相比输入网络的图片大小,长宽都为input的1/16,面积就是1/256了。然后这里有一个注意的点,别人都提到了的就是,我们可以根据卷积网络输出的feature map来还原其中每个值所覆盖的感受野(应该是这样的意思奥)。
以上部分还是比较容易理解,Faster RCNN优于其他方法的重要一点就在接下来的这个RPN网络(Region Proposal Networks)。这部分我感觉我理解的还是不太好。
在这里插入图片描述
这部分的理解,还是直接引用知乎上的那篇比较好的分享吧,说的真好,把我不太懂的讲的很清晰。
https://zhuanlan.zhihu.com/p/31426458

其实RPN最终就是在原图尺度上,设置了密密麻麻的候选Anchor。然后用cnn去判断哪些Anchor是里面有目标的positive anchor,哪些是没目标的negative anchor。所以,仅仅是个二分类而已!

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值