yolov4问答

1.yolov4对于yolov3有哪些改进?

   数据增强:mosaic,adversial training

   mish激活函数

2. mosaic 增强的想法是怎么产生的?什么intuitive?

   比如coco数据集上,小目标很多但是ap,很小,所以想到把大目标缩小,变成小目标来检测。

     如何评价新出的YOLO v4 ? - 康康的回答 - 知乎 https://www.zhihu.com/question/390191723/answer/1185984775

2.darknet的新作者是谁?

   来自俄罗斯的alexey

3.什么是Mish激活函数?图像上看,β=1时的swish和mish差不多啊?为什么mish比swish会好不少呢?https://zhuanlan.zhihu.com/p/139696588

  output = x*tanh(ln(1+e^x))  tanh部分,取值范围[0,1), 相当于是对不激活的一个变化

 

4.什么是sat, Self-adversarial-training?

   每个batch图片,先forward/backward, 然后改变图片,使得网络以为图中没有目标,此时图中目标xywh,并没有改变;然后再次forward/back,检测图中目标。

   参考https://github.com/AlexeyAB/darknet/issues/5117

5.什么是CBM, 什么是CBL?

   conv+bn+mish; conv+bn+leakyRelu

6.yolov4中,所有的激活函数都是mish吗?

   只有主干使用mish,neck和head使用leaky

7.yolov4中,如何使用spp? deeplabv3里面aspp有什么区别?

 spp:spatial pyramid pooling. 类似于对输入图片做多尺度的金字塔concat, 而是对输入特征,使用多种尺寸的卷积核,计算卷积,最后concat.

  aspp: atrous spatial pyramid pooling, 空洞空间金字塔池化,卷积核大小是一样的,但是卷积的rate不一样

   两者的感受野是类似的。

8.csp结构的作用是什么?

   作用是用来降低计算量。因为输入层的featuremap , 分为两部分,来forward

9.什么是drop block?

   是cutout, dropout的结合,把神经网络的一部分去掉

10. PAN和efficientdet里面的BiFPN的区别?

   PAN:path aggregate network, 相当于fpn反过来,

   bifpn:是更普遍的版本,可以fpn+pan, 来回搞任意次,同时去掉只有一个输入的节点

11.loss方面有什么创新

GIOU(Generalized IoU): GIOU = IOU - (闭包-iou/闭包)

  使用了DIOU loss(distane IOU), 考虑了面积,距离,长宽比: IOU - 中心点距离/对角线距离   

  CIOU(complete iou): IOU - (中心点距离)/对角线距离 - 宽高比度量。 最后项是,宽高比的反正切

yolov4, 主要使用CIOIU; yolov5默认是GIOU,可以开启CIOU

12. ultralytics使用pytorch实现的yolov3, yolov5里面的detect层,与darknet原版有什么区别?

 darknet 里面detect层,根据最后面的3个卷积层上的特征点,使用公式,

https://github.com/pjreddie/darknet/blob/4a03d405982aa1e1e911eac42b0ffce29cc8c8ef/src/yolo_layer.c#L88

box get_yolo_box(float *x, float *biases, int n, int index, int i, int j, int lw, int lh, int w, int h, int stride)
{
    box b;
    b.x = (i + x[index + 0*stride]) / lw;
    b.y = (j + x[index + 1*stride]) / lh;
    b.w = exp(x[index + 2*stride]) * biases[2*n]   / w;
    b.h = exp(x[index + 3*stride]) * biases[2*n+1] / h;
    return b;
}

而 ultralystics里面的实现如下,先使用激活函数,sigmoid,把特征约束到0~1之间, 然后如下激活.作者认为darknet里面使用exp, 是没有边界的,会导致训练发散

y = x[i].sigmoid()
y[..., 0:2] = (y[..., 0:2] * 2. - 0.5 + self.grid[i].to(x[i].device)) * self.stride[i]  # xy
y[..., 2:4] = (y[..., 2:4] * 2) ** 2 * self.anchor_grid[i]  # wh

https://github.com/ultralytics/yolov5/blob/master/models/yolo.py#L52

  关于两者区别讨论,见yolov5的issue, https://github.com/ultralytics/yolov5/issues/471

 

  

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
需要学习Windows系统YOLOv4的同学请前往《Windows版YOLOv4目标检测实战:原理与源码解析》,课程链接 https://edu.csdn.net/course/detail/29865【为什么要学习这门课】 Linux创始人Linus Torvalds有一句名言:Talk is cheap. Show me the code. 冗谈不够,放码过来!  代码阅读是从基础到提高的必由之路。尤其对深度学习,许多框架隐藏了神经网络底层的实现,只能在上层调包使用,对其内部原理很难认识清晰,不利于进一步优化和创新。YOLOv4是最近推出的基于深度学习的端到端实时目标检测方法。YOLOv4的实现darknet是使用C语言开发的轻型开源深度学习框架,依赖少,可移植性好,可以作为很好的代码阅读案例,让我们深入探究其实现原理。【课程内容与收获】 本课程将解析YOLOv4的实现原理和源码,具体内容包括:- YOLOv4目标检测原理- 神经网络及darknet的C语言实现,尤其是反向传播的梯度求解和误差计算- 代码阅读工具及方法- 深度学习计算的利器:BLAS和GEMM- GPU的CUDA编程方法及在darknet的应用- YOLOv4的程序流程- YOLOv4各层及关键技术的源码解析本课程将提供注释后的darknet的源码程序文件。【相关课程】 除本课程《YOLOv4目标检测:原理与源码解析》外,本人推出了有关YOLOv4目标检测的系列课程,包括:《YOLOv4目标检测实战:训练自己的数据集》《YOLOv4-tiny目标检测实战:训练自己的数据集》《YOLOv4目标检测实战:人脸口罩佩戴检测》《YOLOv4目标检测实战:中国交通标志识别》建议先学习一门YOLOv4实战课程,对YOLOv4的使用方法了解以后再学习本课程。【YOLOv4网络模型架构图】 下图由白勇老师绘制  
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值