Faster R-CNN Keras版源码史上最详细解读系列之简单介绍

Faster R-CNN Keras版源码史上最详细解读系列之简单介绍

前言

前面有写过一些RCNN系列的文章,毕竟光看源码,其实理解不深,很多的细节原理还得看代码,你会发现里面有很多设计的技巧,能更好的体会这个算法的思想。

最近在看Faster R-CNN Keras版源码,也看了一下资料,希望可以比较完整的来解读下这个源码,网上也有一些文章解读,但是大多的还是比较粗略的,也只能对其略知一二,因为你看源码你会发现比想象的复杂,可能因为我的水平不够吧,哈哈。

没关系,我通过仔细分析源码来对这个算法进行一个全方位的理解,包括数据怎么准备,特征网络VGG怎么用,RPN网络的细节,ROI层做了什么,最后的分类和回归是怎么做的,IOU是什么,非极大抑制是什么等等,包括代码中一些多维数组的维度意义是什么,为什么要这么设计,有什么好处,这样对以后自己用这个算法做其他项目提高一个基础,不然可能都不知道怎么改,一些基础会了之后,后面yolo和ssd算法学起来也更加容易点。

因为可能讲的比较细,所以篇幅会多一点,不过也是结合网上的一些资料加上自己的一些理解,可能大神觉得low了,没关系,我是为入门的服务的,大神提点建议,指点就行了,谢谢。
在这里插入图片描述

Faster R-CNN 简单介绍

Faster R-CNN这个的论文希望大家了解下,从R-CNN发展FastR-CNN再到Faster R-CNN,有了哪些改进,为什么要这么改,最好有个印象。

Faster R-CNN主要还是提出了RPN层,就是解决选取候选框效率低的问题,希望候选框能进行粗略的分类和回归,以便于后续进行有效的预测框选取,最后进行预测和回归。

先看来看这个算法的基本结构吧,大致画了个图,基本上代码分几个部分,第一是图片数据的预处理,你的数据可能是voc格式的,可能是简易的格式,这个后面说详细说道。第二是做图片的特征提取。第三个是RPN网络进行第一次是否是背景的分类和计算回归梯度。第四就是将特征图,图片信息,分类和回归信息给ROI层,其实也就是个方法,让他去进行对于IOU的筛选,再进去非极大抑制,留下比较好的一些框。第五部就是把这些框再进行一次分类和回归:
在这里插入图片描述
第一篇就讲个大概,从后面开始慢慢解读每一部分,希望对入门者有所帮助,当然能力有限,也仅仅是自己的理解,提供个参考吧。

好了,今天就到这里了,希望对学习理解有帮助,大神看见勿喷,仅为自己的学习理解,能力有限,请多包涵。

  • 7
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值