Faster-R-CNN

1整体结构

2更为详细的

 过程描述,向网络中输入一张图片,显示resize到M*N,之后通过我们预训练好的卷积网络,得到feature map。之后在RPN中的2个卷积为1*1网络 分别输出 RPN目标检测框的位置信息和框中是不是背景。如果是背景就把框舍弃。之后使用ROIPooling,将后面网络的输入固定。之后再通过网络输出 检测目标分类的结果和边框回归的结果。

 3RPN的实现

输入的是形状为(h,w,512)的形状,之后通过卷积核为3*3的卷积层,得到(h,w,256)的特征。

在(h,w,256)的特征上我们在每一个像素点根据先验的知识设定了k个anchor boxes。

我们在分别通过卷积核为1*1的卷积,得到形状为(h,w,2K)和(h,w,4k)的结果,分别对应框中有没有物体,和框的位置信息。

4anchor boxes的筛选

我们预设了k个anchor boxes,如果每个anchor boxes都使用的话,会有很大的计算量,而且不是所有的anchor boxes都包括检测的物体。

我们把anchor boxes与groundtruth进行IoU操作,大于阈值的为正样本保留,反之舍弃。

5关于anchor boxes的预设

论文中指定了3种scal即边框大小和3种aspect ratio 宽高比例

相乘共得到9个anchor boxes。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值