fastRCNN

VOC 数据集 :
链接:https://pan.baidu.com/s/1oLInUqj8gIp1nn6ahISwOA
提取码:ryfs
复制这段内容后打开百度网盘手机App,操作更方便哦

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

anchors
在这里插入图片描述
在这里插入图片描述
遍历Conv layers计算获得的feature maps,为每一个点都配备这9种anchors作为初始的检测框

那么Anchor一共有多少个?
(12996, 4)
38 *38 *9=12996

在这里插入图片描述
实际上通过anchors就引入了检测中常用到的多尺度方法。

Comment:其实RPN最终就是在原图尺度上,设置了密密麻麻的候选Anchor。然后用cnn去判断哪些Anchor是里面有目标的foreground anchor,哪些是没目标的backgroud。所以,仅仅是个二分类而已!

显然这里面有一部分边缘anchors会超出图像边界,而真实中不会有超出图像的目标,所以会有clip anchor步骤
在这里插入图片描述

RPN

在这里插入图片描述

其实RPN最终就是在原图尺度上,设置了密密麻麻的候选Anchor。然后用cnn去判断哪些Anchor是里面有目标的positive anchor,哪些是没目标的negative anchor。所以,仅仅是个二分类而已!

边框回归的训练过程

参考 : https://blog.csdn.net/xiewenbo/article/details/78320796

在这里插入图片描述
在这里插入图片描述
smothl1损失函数
在这里插入图片描述
smooth L1损失函数曲线如下图9所示,作者这样设置的目的是想让loss对于离群点更加鲁棒,相比于L2损失函数,其对离群点、异常值(outlier)不敏感,可控制梯度的量级使训练时不容易跑飞。
在这里插入图片描述
ROI Pooling部分

ROI Pooling做了两件事:1、从feature maps中“抠出”proposals(大小、位置由RPN生成)区域;2、把“抠出”的区域pooling成固定长度的输出

解疑阶段

前景和背景交界地带的anchor不参与训练。这些交界地带即不作为前景也不作为背景,以防出现错误的分类。在作者原文里把IOU>0.7作为标注成前景的门限,把IOU<0.3作为标注成背景的门限,之间的值就不参与训练,IOU是anchor与ground truth的重叠区域占两者总覆盖区域的比例,见示意图4;

在这里插入图片描述

参考: 从结构、原理到实现,Faster R-CNN全解析(原创)
RCNN到Faster R-CNN笔记
一文读懂Faster RCNN

Keras搭建Faster-RCNN目标检测平台

使用labelimg进行目标检测数据集标注

windows下使用labelImg标注图像
链接:https://pan.baidu.com/s/1P_j-V2uiBJl9JEfSZGGimQ
提取码:avjq
注意下载过程中不要有中文

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值