You Only Look Once

linlinlinle

于 2018-10-16 11:32:08 发布

阅读量141

点赞数

分类专栏：视觉盛宴文章标签：目标检测 YOLO CNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linshuo1994/article/details/83069834

版权

视觉盛宴专栏收录该内容

5 篇文章 1 订阅

订阅专栏

将目标检测作为回归问题,整张图作为网络的输入，将物体检测与分类合到一起，整张图作为输入，输出为回归bounding box的位置信息和其所属的类别

DPM：使用滑动窗口，对每个分区进行分类
RCNN：具有复杂的管道而且是缓慢和难以优化，因为每个组件必须单独训练

基本思路

将图片分为S*S的区域，此处不是RCNN那样对每个区域进行分类，而是进过CNN后，得到S*S个像素点的特征图
每个网格单元负责检测目标中心落在此处的目标,网格单元预测B个bbox回归信息和置信度分数（回归信息有4个值，x和y是bbox相对于网格的偏移量，w和h是bbox相对于整张图的尺寸比例。confidence代表了所预测的bbox中含有object的置信度和这个box预测的有多准两重信息）
最后特征图是 S*S, 每个像素点有B个5坐标Bbox位置信息和1个类别信息，S*S*（B*5+C)
吴恩达:S*S*B*(5+C).每个bbox都是自己的分类结果

上述中confidence的计算公式为：如果有object落在一个grid cell里，Pr(Object)取1，否则取0

$Pr(object)*IOU_{pred}^{truth}$

每个网格预测的class信息 $Pr(Class_{i}|Object)$ 和每个bbox所预测的confidence相乘，得到每个bbox的class-specific confidence score：

得到每个bbox属于某一类的概率。对class-specific confidence score设置阈值进行筛选，并通过NMS得到最终结果

训练

对训练数据中的每个ground truth，指定S*S*B个bbox中的一个与之对应（IOU最大）
confidence取值：对所有bbox，若与ground truth对应，取值应为两者的IOU，其他bbox为0
激活函数：leaky rectified linear activation:漏泄ReLu：

$\phi (x) = \left\{\begin{matrix} x \quad if x>0\\ 0.1x \quad otherwise \end{matrix}\right.$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
You Only Look Once

将目标检测作为回归问题,整张图作为网络的输入，将物体检测与分类合到一起，整张图作为输入，输出为回归bounding box的位置信息和其所属的类别DPM：使用滑动窗口，对每个分区进行分类 RCNN：具有复杂的管道而且是缓慢和难以优化，因为每个组件必须单独训练基本思路将图片分为S*S的区域，此处不是RCNN那样对每个区域进行分类，而是进过CNN后，得到S*S个像素点的特征图每个网格...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。