YOLOV6网络结构

1.整体结构

 由上图所示,从整体上来看,YOLOV6的网络结构与YOLOV4、YOLOV5是很相似的,尤其是backbone和neck,但是其中的实现模块是有变化的;但最大的不同在于Head部分,采用的是YOLOX的Head方式,将分类与回归分为两个支路,进行了解耦操作;具体内容下面将会详细的介绍。

2. Backbone

 可见,Backbone的实现的基本模块为RVB1_X结构,其全程为RepVGGBlock_X,表示由多个RepVGGBlock组成;

(1)RepVGGBlock

 上图是RepVGGBlock论文中绘制的图像,整个网络包括两种残差结构,如上图中的绿框红框

<1> 绿框

其残差结构仅仅包含Conv1*1残差分支,用另一种表示为:

  两种的不同在于,Rep-I使用的Conv+BN模块,其步长都为2,用于进行降采样,如主干网络中的下面红框中的两种,Rep-!hui进行降采样,将输入降采样到1*32*320*320,而剩余的RVB1_X模块中,其第一个RepVGGBlock都是采用的Rep-I的方式,先进行降采样。

<2> 红框 

红框不仅包含Conv1*1的残差结构,而且包含了一个Identity分支,这里常用BN层表示,如下图所示

 其另一种表示为:

 其中的卷积为1*1和3*3,且步长为1,通常是通道和size没有变化,常用在RVB1_X中的后面部分,如下图所示:

(2)SimSPPF

    结构如下图所示:

     其与YOLOV4、YOLOV5中的SPP结构是类似的,目的都是为了正大感受野,但是不同的是这里将9*9和13*13的池化核都用5*5的池化核来表示,极大的降低了计算量。

3. Neck部分

    结构上与YOLOV4的PANet结构类似,先上采样融合再下采样融合,但是这里却将基本模块更换为了效果更佳的RepVGGBlock结构,整体结构如下图所示:

   等同于:

        其中重要的结构有两种,分别为RVB2_XRVB3_X,其实两种结构基本上是一样的,其最大的不同在于它们的第一个RepVGGBlock结构,从上图可见,经过RVB2_X的特征图的通道数是有所变化的,而经过RVB3_X的特征图的通道是没有变化的。

 4. Head部分

        和YOLOX一样,YOLOv6也对检测头进行了解耦,分开了边框与类别的分类过程。将边框回归和类别分类耦合在一起时会影响性能,因为这样不仅加慢收敛的速度,也会提高检测头的复杂程度。 

  • 2
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Yolov3网络结构由几个基本组件组成。其中,CBL是Yolov3网络结构中的最小组件,由Conv+Bn+Leaky_relu激活函数三者组成。Res unit是借鉴了Resnet网络中的残差结构,使得网络可以构建得更深。ResX由一个CBL和X个残差组件构成,是Yolov3中的大组件。每个Res模块前面的CBL起到下采样的作用,因此经过5次Res模块后,得到的特征图大小从608变为304、152、76、38、19。除了这些基本组件外,还有一些其他基础操作,如Concat(张量拼接)和add(张量相加)。在Yolov3的主干网络Backbone中,共有52个卷积层,再加上一个FC全连接层,组成了Darknet53分类网络。需要注意的是,在目标检测Yolov3中,去掉了FC层,但仍然称其为Darknet53结构。\[1\] 另外,通过观察预测层的结构,我们可以清晰地看到它们分别来自哪个部分,并且Concatenate层与哪个层进行拼接。需要注意的是,Convolutional指的是Conv2d+BN+LeakyReLU,与Darknet53图中的一样,而生成预测结果的最后三层只是Conv2d。通过这些信息,我们可以更容易地搭建出Yolov3的网络框架。\[2\] 如果对Yolov3网络结构还有疑惑,可以参考Github上一些大牛们基于Tensorflow搭建的Yolov3模型的代码进行进一步分析。\[3\] #### 引用[.reference_title] - *1* [Yolov3网络架构分析](https://blog.csdn.net/wujianing_110117/article/details/119381158)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [YOLO v3网络结构分析](https://blog.csdn.net/qq_37541097/article/details/81214953)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值