[目标检测]YOLOv3

背景

理解一个模型的原理,主要是看模型的输入是什么,以及输出是如何定义的。因为大多数模型的结构都是全卷积层,只有输出是存在差异的。
输入320x320,精度和ssd一样,但速度是ssd的三倍。

模型输出

Bounding Box Prediction

通过网格的方法建模
每个网格负责预测bounding box中心点落在自己区域的目标。
t x t_{x} tx 相对所属网格左上角横坐标的偏移量
t y t_{y} ty 相对所属网格左上角纵坐标的偏移量
t w t_{w} tw 相对对应anchor的对数大小
t h t_{h} th 相对对应anchor的对数大小
解析目标框在这里插入图片描述
c x c_{x} cx c y c_{y} cy)网格的左上角坐标
p w p_{w} pw p h p_{h} ph prior box的宽和高

解析bounding box
在这里插入图片描述
通过sigmoid函数来预测物体中心点相对网格左上角的相对位置

Objectness Score

目标置信度逻辑回归(sigmoid)得到目标的置信度
YOLOv3 predicts an objectness score for each bounding
box using logistic regression.

目标如何与prior box匹配
论文原文:
This should be 1 if the bounding box prior overlaps a ground truth object by more than any other bounding box prior. If the bounding box prior is not the best but does overlap a ground truth object by more than some threshold we ignore the prediction,Unlike faster rcnn our system only assigns one bounding box prior for each ground truth object.
在yolov3中一个gt只能被一个prior boxes预测。而在其他anchor系列的模型中,一个gt是可以被多个anchor预测的。

Class Prediction

通过逻辑回归输出每个类别上的得分在这里插入图片描述
输出channel长度为255
在这里插入图片描述

loss

回归用MSE
分类用CE

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值