VOC 数据集 :
链接:https://pan.baidu.com/s/1oLInUqj8gIp1nn6ahISwOA
提取码:ryfs
复制这段内容后打开百度网盘手机App,操作更方便哦
anchors
遍历Conv layers计算获得的feature maps,为每一个点都配备这9种anchors作为初始的检测框
那么Anchor一共有多少个?
(12996, 4)
38 *38 *9=12996
实际上通过anchors就引入了检测中常用到的多尺度方法。
Comment:其实RPN最终就是在原图尺度上,设置了密密麻麻的候选Anchor。然后用cnn去判断哪些Anchor是里面有目标的foreground anchor,哪些是没目标的backgroud。所以,仅仅是个二分类而已!
显然这里面有一部分边缘anchors会超出图像边界,而真实中不会有超出图像的目标,所以会有clip anchor步骤
RPN
其实RPN最终就是在原图尺度上,设置了密密麻麻的候选Anchor。然后用cnn去判断哪些Anchor是里面有目标的positive anchor,哪些是没目标的negative anchor。所以,仅仅是个二分类而已!
边框回归的训练过程
参考 : https://blog.csdn.net/xiewenbo/article/details/78320796
smothl1损失函数
smooth L1损失函数曲线如下图9所示,作者这样设置的目的是想让loss对于离群点更加鲁棒,相比于L2损失函数,其对离群点、异常值(outlier)不敏感,可控制梯度的量级使训练时不容易跑飞。
ROI Pooling部分
ROI Pooling做了两件事:1、从feature maps中“抠出”proposals(大小、位置由RPN生成)区域;2、把“抠出”的区域pooling成固定长度的输出
解疑阶段
前景和背景交界地带的anchor不参与训练。这些交界地带即不作为前景也不作为背景,以防出现错误的分类。在作者原文里把IOU>0.7作为标注成前景的门限,把IOU<0.3作为标注成背景的门限,之间的值就不参与训练,IOU是anchor与ground truth的重叠区域占两者总覆盖区域的比例,见示意图4;
参考: 从结构、原理到实现,Faster R-CNN全解析(原创)
RCNN到Faster R-CNN笔记
一文读懂Faster RCNN
windows下使用labelImg标注图像
链接:https://pan.baidu.com/s/1P_j-V2uiBJl9JEfSZGGimQ
提取码:avjq
注意下载过程中不要有中文