YOLOV3

俺想发SCI

已于 2022-07-25 19:07:09 修改

阅读量859

点赞数

文章标签：深度学习计算机视觉人工智能

于 2022-07-25 18:26:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yoyo211399/article/details/125965479

版权

YOLOv3性能作者直接把性能花在Retinanei数据图上了

左图是不同阈值右图是阈值0.5

map就是算出的所有阈值的ap做平均

为啥第一个图比第二个图低呢？因为第一个图是阈值达到0.95 那得和标注的多重合啊那得多了不起啊 so 肯定没有那么强就低了点。而第二个阈值0.5 重合0.5就行那就肯定比0.95高啊

反正作者说了高阈值性能不科学哈哈哈哈

YOLOV2是Darknet-19 有19层

53 就是52个卷积和一个全连接层并且里面加了残差连接

骨干网络最最重要啦！！！！！！！！！！！！！！！！各个领域都是以骨干网络提取的特征来进行后处理得到的！！他是提供食材的人目标检测头或者关键点检测头是做饭的厨师

52个卷积是把所有的convolutional加上不算residual哦一共是52 然后加上最后的全连接层=53

训练好这个IMagnet一千分类的骨干网络之后后面的全局平均池化层拿掉他就是作为特征提取器

注意里面的步长为2哦可能是2导致的下采样

输入图像得到三种尺度特征在进行后续多尺度目标检测。

这三个尺度分别下采样了32 16 8倍

如果输入416*416 图片下采样：416/32=13*13 26*26 416/8= 52* 52

因为把后面的分类头拿掉他就变成了全卷积网络里面没有全连接层所以可以兼容任意尺度的图像

256 608 416 只要是32的倍数因为我们下采样是32的倍数哦

第二个坐标开始：性能不错运算量小更高效运算GPU fps更臃肿一些有点慢但是也高于v1用的19

浮点运算量更高效利用GPU

v1 gridcell=7 24层卷积2全连接层 boundingbox

v2 gridcell=13 Darknet-19 18卷积+1全连接层 anchor（先验框是那种已经差不多检验高瘦物体的anchorbox就都是那种高瘦的anchorbox）

知乎江da白绘制的图

输入416*416*3 输出是三个尺寸的featuremap13*13*255、 26*26255、52*52*255

255---------------3* 85 3：每个gc生成3个anchor 每个anchor对应一个预测框每个预测框对应5+80维 5：xywhc coco数据集80个类别的条件类别概率

13*13*255对应原图像的感受野就是32*32、那也就是说13*13负责预测大物体

因为416/13=32 那个13就是分格格呀 gc啦

26*26255 16*16、中等

52*52*255 8*8 、小物体

上采样2倍（3*2 =26）在和骨干网络26*26尺度的特征进行拼接经过处理得到26*26*255

concat ：两个作业本摞起来的操作两个本厚度不一样就沿着厚度方向摞起来

26*26这个也上采样2倍（26*2=52）和骨干网络52*52尺度的特征拼接处理得到 52*52*255的特征

也就是说：其实最后那个52*52*255的特征融合了前面26*26特征也融合了13*13的特征

发挥了深层网络的语义特化抽象的特征也充分利用了浅层网络的细粒度的像素级别的边缘转角结构信息的底层特征

多尺度特征融合不同尺度物体检测

条件概率：假设这个框已经存在物体了他是猫的概率狗的概率

骨干颈部头

Backnone提取 Neck融合特征fpn head最终预测结果

骨干是全卷积网络没有全连接可以兼容32倍数的不同尺度

共有9个anchor

不再看物体中心点落在哪个gridcell里了看谁的anchor的iou与物体的iou最大由大的那个anchor（预测框）预测物体

非最大的就不是正样本

后验概率的置信度可视化能看见每个框能看见是数字

YOLOV3 过程

狗人工标注的黄色框中心点是红色的那个框吧

红色那个gc会有三个anchor 找到与标注框iou最大的那个anchor 用他来预测物体

YOLOV1是最多98个

输入图像越大得到的gridcell也大预测框的数量就是gridsize的数量*3 ，得到的三个尺度的预测框数量也多

正负样本的选取！！！！！！！！！！！！！！！！！！！！！！！！！！！iou

大于阈值 iou最大正样本

大于阈值但不是iou最大忽略

小于阈值就是负样本蓝色和绿色！！

不同代码可能实现的损失函数不一样

训练

测试

conf-score就是那个后验概率

代码

评估指标

加dense模块空间金字塔池化 spp

精读视频

256/8=32 32*32对应原图的感受野是8*8

416/8=52 52*52对应原图的感受野也是8*8

416/32=13 感受野是32 感受野大预测大物体

残差 batchnomalzation （BN）都是很常用的配置

用了就可以来引用文献啦

性能指标！！！！！！子豪兄的论文

论文里的IOUthresh=0.5

Pthresh是置信度阈值假设0.2吧

两个都是人工指定的

根据预测框和gt的iou就能知道他在哪个区间就是下面那四个可能

FP 本来是背景但是还给他预测出来了本来是没有猫但是预测出一个小猫的框

FN 定位不错但是置信度预测出来的太小了

TP 除以竖着

TP 除以横着

map0.5求一次平均 0.5:0.95求单独类别的平均还得再求每个类别的平均

4.

Focal loss 看重暧昧的那个人也给他高权重效果nonono

loss

绿绿黄三个数非零即1

这三项都遍历了所有的预测框

假设猫的预测值Pc gt是猫

第一项 -log（pc）： -log猫的预测值预测值越接近1 loss越小

第二项BCE是猫标签Cihat是1

没听懂

传送带：大佬们的文章

【目标检测论文精读】……YOLO-V3 ……（搞笑向学术报告---An Incremental Improvement）_深度不学习！！的博客-CSDN博客_yolov3论文题目文章目录1.V1,V2回顾：2.Abstract（摘要）3.Introduction（引言）4.The Deal（处理）5.yolov3结构模型：今天看一下yolov3吧，据说这是原yolo作者的最后一篇论文，v4，v5都是其他人写的了。这篇并不算是一个严谨的论文，而是像一篇搞笑向学术报告，不过看上去格式还算正规，并没有像hinton大佬的那一篇dropout那样乱哈哈。论文题目： An Incremental Improvement论文下载地址:https://arxiv.org/pdf/1804https://blog.csdn.net/qq_38737428/article/details/124912050

YOLO v3网络结构分析_太阳花的小绿豆的博客-CSDN博客_yolov3网络结构相信阅读了YOLO v3论文的小伙伴们会发现为什么这次的论文篇幅这么少？除去参考文献就四面？Excuse me？我是下了篇假文献吧。读完后感觉内容确实不多，而且总感觉写的不够细致，很多地方都比较模糊，可能是作者想让大家去观摩他的代码吧。本人是小白，看后表示有点蒙。于是在Github上搜了大牛们基于Tensorflow搭建的YOLOv3模型进行分析（本人只接触过TF，所以就不去看caffe的源码...https://blog.csdn.net/qq_37541097/article/details/81214953?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522165874694016782425116611%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=165874694016782425116611&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_positive~default-1-81214953-null-null.142%5Ev33%5Epc_rank_34,185%5Ev2%5Econtrol&utm_term=yolov3%E7%BD%91%E7%BB%9C%E7%BB%93%E6%9E%84&spm=1018.2226.3001.4187 霹雳

目标检测经典论文——YOLOv3论文翻译：YOLOv3: An Incremental Improvement（YOLOv3：增量式的改进）_bigcindy的博客-CSDN博客YOLOv3: An Incremental ImprovementYOLOv3：增量式的改进Joseph Redmon Ali FarhadiUniversity of WashingtonAbstractWe present some updates to YOLO! We made a bunch of little design changes to make it better. We also trained this new networ...https://blog.csdn.net/Jwenxue/article/details/107717537?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522165871767916782184643988%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=165871767916782184643988&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~rank_v31_ecpm-9-107717537-null-null.185^v2^control&utm_term=yolo&spm=1018.2226.3001.4450

【目标检测论文精读】……YOLO-V3 ……（搞笑向学术报告---An Incremental Improvement）_深度不学习！！的博客-CSDN博客文章目录1.V1,V2回顾：2.Abstract（摘要）3.Introduction（引言）4.The Deal（处理）5.yolov3结构模型：今天看一下yolov3吧，据说这是原yolo作者的最后一篇论文，v4，v5都是其他人写的了。这篇并不算是一个严谨的论文，而是像一篇搞笑向学术报告，不过看上去格式还算正规，并没有像hinton大佬的那一篇dropout那样乱哈哈。论文题目： An Incremental Improvement论文下载地址:https://arxiv.org/pdf/1804https://blog.csdn.net/qq_38737428/article/details/124912050

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
YOLOV3

YOLOv3 个人笔记最后有附上大佬们文章的连接
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。