目标检测一些内容

最近学习一下目标检测,遇到的一些问题存在这里以备使用。

不同标识物体的框:

  • 边界框,bounding box,用于标识物体的位置,常用格式有左上右下坐标,即xyxy;中心宽高,即xywh。
  • 真实框,Ground truth box, 是人工标注的位置,存放在标注文件中
  • 预测框,Prediction box, 是由目标检测模型计算输出的框
  • 锚框,Anchor box,根据数据集的对象位置类聚出来,用于预测框计算做参考;基于这个参考,算法生成的预测框仅需要在这个锚框的基础上进行“精修或微调fine-tuning”即可,这样算法可以收敛的更快,检测效果更好。

faster-rcnn中的正负样本:

在分类问题中,这个问题相对好理解一点,比如人脸识别中的例子,正样本很好理解,就是人脸的图片,负样本的选取就与问题场景相关,具体而言,如果你要进行教室中学生的人脸识别,那么负样本就是教室的窗子、墙等等,也就是说,不能是与你要研究的问题毫不相关的乱七八糟的场景图片。

在目标检测中,正负样本不是真实标注的,而是网络选取出的anchor,对于每一个Ground_truth bounding_box 从anchor中选取和它重叠度最高的一个anchor作为样本。从剩下的anchor中选取和Ground_truth bounding_box重叠度超过0.7的anchor作为样本,注意正样本的数目不能超过128。随机的从剩下的样本中选取和gt_bbox重叠度小于0.3的anchor作为负样本,正负样本之和为256。

faster-rcnn中的RPN:

生成候选区域,先生成基础anchor(9个框),再生成针对每一个特征的anchor,要对应到原图中,因为生成特征图时进行了池化操作,感受野不同,在所有的anchor中选出最有可能的anchor(正负样本?),最后再进行调整(坐标偏移)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值