飞桨 7日目标检测第4日 学习笔记

输出部分yolo v3输出了3个不同尺度的feature map,如上图所示的y1, y2, y3,该做法借鉴了FPN(feature pyramid networks),采用多尺度来对不同size的目标进行检测:
对于COCO类别而言,有80个种类,所以每个box应该对每个种类都输出一个概率,YOLOv3设定的是每个网格单元预测3个box,所以每个box需要有(x, y, w, h, confidence)五个基本参数,然后还要有80个类别的概率。所以3 * (5 + 80) = 255 这个255是指通道数。

第八页PPT中提到的kmeans聚类anchor:是把所有真实框的数据由kmeans算法聚类得到9类锚框(anchor)

参考https://blog.csdn.net/qq_34199326/article/details/84109828?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param里给出的解释:

 这里解释一下anchor box,YOLO3为每种FPN预测特征图(13*13,26*26,52*52)设定3种anchor box,总共聚类出9种尺寸的anchor box。在COCO数据集这9个anchor box是:(10x13),(16x30),(33x23),(30x61),(62x45),(59x119),(116x90),(156x198),(373x326)。分配上,在最小的13*13特征图上由于其感受野最大故应用最大的anchor box (116x90),(156x198),(373x326),(这几个坐标是针对416*416下的,当然要除以32把尺度缩放到13*13下),适合检测较大的目标。中等的26*26特征图上由于其具有中等感受野故应用中等的anchor box (30x61),(62x45),(59x119),适合检测中等大小的目标。较大的52*52特征图上由于其具有较小的感受野故应用最小的anchor box(10x13),(16x30),(33x23),适合检测较小的目标。同Faster-Rcnn一样,特征图的每个像素(即每个grid)都会有对应的三个anchor box,如13*13特征图的每个grid都有三个anchor box (116x90),(156x198),(373x326)(这几个坐标需除以32缩放尺寸)

下图解释了anchor与真实框的匹配方法,老师课上讲了,但是我没记住...:

 上面这个网络结构图画的挺好,留着了~

 为什么要有三个输出分支?因为要得到3个不同尺度的特征输出。

置信度:就是有多大概率,是预测的这个类。

先验框(锚框)是由所有真实框的数据通过kmeans算法聚类得到的。先验框的作用是:方便得到好的预测框。

网格是对输入图像进行卷积池化后得到的特征输出上的东西,每个网格上都有锚框,每个锚框对应一个预测框(网格数*锚框数=预测框数)

 

 

 

 上图中展示了NMS的作用,就是为了把不好的框都丢掉,只保留最好的框。

如果两个真实框落在同一个网格上,还匹配了同一个锚框,就不计算该损失,因为如果丢弃的话可能会造成不好的影响,反倒是放任它不管,就不会造成什么影响。 

上图为用到的损失函数。

1中的one-hot是指概率最大的那个类别。

 

https://blog.csdn.net/qq_36790747/article/details/108756132这是别人的第三日课的笔记,写的不错,我保存了~ 

那篇博客里面介绍了单阶段和双阶段检测,anchor的含义与作用,RoI Pooling 文章的后半部分解释了yml配置文件中的一些设置,感觉写的挺准确。

单阶段检测模型:YOLO, SSD, Retina-Net

 两阶段检测模型:RCNN, SPPNet

 

百度飞桨7日目标检测课程:https://aistudio.baidu.com/aistudio/course/introduce/1617

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值