五山一胖-CSDN博客

原创【YOLO改进】换遍主干网络之CVPR2024 微软新作StarNet：超强轻量级Backbone（基于MMYOLO）

2. 修改starnet.py中的forward函数，并且添加out_dices参数使其能够输出不同stage的特征向量。（元素乘法）在无需加宽网络下，将输入映射到高维非线性特征空间的能力。3. 将class StarNet注册并且在__init__()函数中进行修改。，在紧凑的网络结构和较低的能耗下展示了令人印象深刻的性能和低延迟。1. 在上文提到的仓库中下载imagenet/starnet.py。CVPR2024 Rewrite the Stars论文揭示了。4. 修改配置文件，

2024-05-21 07:03:20 9381 3

原创【YOLO改进】换遍MMPretrain TIMM主干网络之EfficientNet-B1（基于MMYOLO）

TIMM库中的模型经过了精心的优化，具有较高的计算效率和较低的推理延迟。这与YOLO网络的实时性需求高度契合，可以在保持高检测精度的同时，保证足够快的推理速度。： TIMM库提供了丰富的配置选项，用户可以根据具体需求自定义模型的各个参数，如输入尺寸、卷积核大小、层数等。：使用TIMM库中的预训练模型作为YOLO的主干网络，可以显著加速训练过程，减少所需计算资源，并提高模型初始性能。这对于需要快速部署的应用场景尤为重要。： TIMM库对每个模型都进行了精心的优化，包括高效的实现和内置的性能调优工具。

2024-05-20 08:13:41 951 2

原创【YOLO改进】换遍MMPretrain主干网络之ConvNeXt-Tiny（基于MMYOLO）

ConvNeXt-Tiny 是一种改进的卷积神经网络架构，其设计目的是在保持传统卷积神经网络优势的同时，借鉴了一些Transformer架构的成功经验。： ConvNeXt-Tiny 采用了更大范围的卷积核和较少的池化操作，这使得它在同样的计算预算下，能够捕捉到更丰富的特征信息，提高了模型的性能。其优化的卷积架构可以在保证精度的同时，提供更快的推理速度。： ConvNeXt-Tiny 的模型大小和复杂度适中，这使得它可以在保持高检测精度的同时，不会大幅增加YOLO网络的计算负担。

2024-05-19 07:10:04 1462

原创【YOLO改进】换遍MMPretrain主干网络之ShuffleNetV1（基于MMYOLO）

ShuffleNetV1通过“通道洗牌”操作来解决这个问题，即在每次组卷积之后重新排列通道，使得不同组之间的信息能够相互混合，从而增强网络的表达能力。：YOLO的实时性要求其主干网络必须具有高效的计算能力和低延迟。：随着移动和嵌入式设备上目标检测需求的增加，ShuffleNetV1由于其高效性和低资源需求，非常适合在这些设备上部署YOLO模型，实现实时目标检测。：通过结合组卷积和通道洗牌，ShuffleNetV1在保持高精度的同时极大地减少了参数量和计算复杂度，使其非常适合在移动设备和嵌入式系统中部署。

2024-05-17 10:01:09 1110

原创【YOLO改进】换遍MMPretrain主干网络之MobileNetV3（基于MMYOLO）

MobileNetV3是由Google团队在2019年提出的轻量化网络模型。传统的卷积神经网络内容需求大、运算量大，无法再移动设备以及嵌入式设备上运行，为了解决这一问题，MobileNet网络应运而生。MobileNetV3在MobileNet系列的基础上进行了进一步的优化和改进，旨在实现更小的模型大小、更低的计算成本和更高的性能。YOLO（You Only Look Once）是一种流行的实时目标检测算法，其核心思想是将目标检测任务转化为单次前向传播过程。

2024-05-16 20:59:59 2118

原创【YOLO改进】换遍MMDET主干网络之EfficientNet（基于MMYOLO）

EfficientNet是Google在2019年提出的一种新型卷积神经网络架构，其设计初衷是在保证模型性能的同时，尽可能地降低模型的复杂性和计算需求。EfficientNet的核心思想是通过均衡地调整网络的深度（层数）、宽度（每层的通道数）和分辨率（输入的图像尺寸）这三个维度，以实现模型的性能最大化。具体来说，EfficientNet使用了一个复合缩放方法（compound scaling method），该方法将深度、宽度和分辨率的缩放比例视为一个整体进行考虑，而不是分别进行缩放。

2024-05-12 06:53:06 1179

原创【YOLO改进】换遍MMDET主干网络之Pyramid Vision Transformer（PVT）（基于MMYOLO）

Pyramid Vision Transformer（PVT）是一种深度学习模型，它结合了Transformer架构和金字塔结构，旨在将Transformer的强大能力引入计算机视觉任务中，特别是那些需要密集预测的任务，如目标检测、语义分割等。PVT的主要特点在于其金字塔结构的设计。与原始的Vision Transformer（ViT）相比，PVT在多个阶段使用了不同尺度的特征图，从而形成了金字塔结构。这种设计使得PVT能够捕获不同尺度的特征信息，提高了模型对图像中不同大小目标的处理能力。

2024-05-11 08:41:26 1063

原创【YOLO改进】换遍MMDET主干网络之Pyramid Vision Transformerv2（PVTv2）（基于MMYOLO）

Pyramid Vision Transformer v2（PVTv2）是在PVTv1的基础上进行改进的一种深度学习模型，它同样结合了Transformer架构和金字塔结构，旨在提供更强大的特征表示和更好的性能。通过这些改进，PVTv2在多个基本视觉任务（如分类、检测和分割）上实现了显著的性能提升，并且在参数量和计算量方面也具有更好的优化。

2024-05-11 08:39:43 1599

原创【YOLO改进】换遍MMDET主干网络之Res2Net（基于MMYOLO）

Res2Net的核心结构是一个多分支的残差块，每个分支都有自己的卷积层，负责处理不同分辨率的特征。此外，Res2Net还可以在不增加网络深度的情况下提高网络性能，因此在一些计算资源有限的任务中，也具有一定的优势。Res2Net是ResNet（残差网络）的一种改进版本，主要通过引入多分支的结构和逐级增加的分辨率来提高网络的表达能力。Res2Net的核心思想是将多个分支的信息融合在一个残差块中，以提高网络对不同分辨率的特征的表达能力。

2024-05-10 08:42:45 982

原创【YOLO改进】换遍MMDET主干网络之MobileNetv2（基于MMYOLO）

OpenMMLab 2.0 体系中 MMYOLO、MMDetection、MMClassification、MMSelfsup 中的模型注册表都继承自 MMEngine 中的根注册表，允许这些 OpenMMLab 开源库直接使用彼此已经实现的模块。MobileNetV2是一种专为移动和嵌入式视觉应用设计的轻量化网络结构。它在MobileNetV1的基础上引入了两个主要的创新点：反转残差结构（Inverted Residuals）和线性瓶颈层（Linear Bottlenecks）。

2024-05-09 08:05:38 1276

原创【YOLO改进】换遍MMDET主干网络之SwinTransformer-Tiny（基于MMYOLO）

SwinTransformer-Tiny是Swin Transformer模型的一个轻量级版本。Swin Transformer是微软亚洲研究院在2021年提出的一种新型的视觉Transformer，它通过引入移位窗口（Shifted Windows）的概念，实现了层次化的特征表示和线性的计算复杂度，使其在各种视觉任务中都取得了出色的性能。SwinTransformer-Tiny作为轻量级版本，继承了Swin Transformer的核心思想，但在网络深度和宽度上进行了缩减，以适应更轻量级的计算需求。

2024-05-08 07:58:56 1589

原创【YOLO改进】换遍MMDET主干网络之ResNet50（基于MMYOLO）

OpenMMLab 2.0 体系中 MMYOLO、MMDetection、MMClassification、MMSelfsup 中的模型注册表都继承自 MMEngine 中的根注册表，允许这些 OpenMMLab 开源库直接使用彼此已经实现的模块。这种设计使得在增加网络深度的同时，不会出现梯度消失的问题，进而提升了模型的性能。在YOLO的算法框架中，主干网络负责提取图像中的特征信息，对于模型的性能至关重要。这种设计使得模型在保持相同复杂性的情况下，能够有更深的网络结构。

2024-05-07 07:42:35 1516

原创【YOLO改进】换遍IoU损失函数之Focal IoU Loss（基于MMYOLO）

在目标检测任务中，评估预测边界框的质量是一个重要环节。传统的 IoU（Intersection over Union）损失函数虽然能够评估预测边界框与真实边界框的重叠程度，但在某些情况下存在一些问题。例如，当预测边界框与真实边界框的重叠度较低时，IoU 损失函数的梯度会非常小，导致模型难以进行优化。由于MMYOLO中没有实现Focal IoU损失函数，所以需要在mmyolo/models/iou_loss.py中添加Focal IoU的计算和对应的iou_mode，修改完以后在终端运行。

2024-05-06 09:07:13 1857 1

原创【YOLO改进】换遍IoU损失函数之WIoU Loss（基于MMYOLO）

在针对YOLO的改进中，通过替换损失函数常常可以达到“无痛提点”的效果，本文将基于MMYOLO框架介绍如何用WIoU损失函数替换YOLO中常用的CIoU损失函数。

2024-05-05 10:34:38 2578

原创【YOLO改进】换遍IoU损失函数之ShapeIoU Loss（基于MMYOLO）

在针对YOLO的改进中，通过替换损失函数常常可以达到“无痛提点”的效果，本文将基于MMYOLO框架介绍如何用ShapeIoU损失函数替换YOLO中常用的CIoU损失函数。

2024-05-04 09:15:25 1590 2

原创【YOLO改进】换遍IoU损失函数之Innerciou Loss（基于MMYOLO）

由于MMYOLO中没有实现Inner CIoU损失函数，所以需要在mmyolo/models/iou_loss.py中添加Inner CIoU的计算和对应的iou_mode，修改完以后在终端运行。再在配置文件中进行修改即可。

2024-05-03 08:59:16 817 1

原创【YOLO改进】换遍IoU损失函数之Innersiou Loss（基于MMYOLO）

在针对YOLO的改进中，通过替换损失函数常常可以达到“无痛提点”的效果，本文将基于MMYOLO框架介绍如何用Inner SIoU损失函数替换YOLO中常用的CIoU损失函数。

2024-05-02 09:47:36 1690

原创【YOLO改进】换遍IoU损失函数之EIoU Loss（基于MMYOLO）

在针对YOLO的改进中，通过替换损失函数常常可以达到“无痛提点”的效果，本文将基于MMYOLO框架介绍如何用DIoU损失函数替换YOLO中常用的EIoU损失函数。

2024-05-01 08:24:06 1940

原创【YOLO改进】换遍IoU损失函数之DIoU Loss（基于MMYOLO）

在针对YOLO的改进中，通过替换损失函数常常可以达到“无痛提点”的效果，本文将基于MMYOLO框架介绍如何用DIoU损失函数替换YOLO中常用的CIoU损失函数。

2024-04-30 07:43:30 1417

原创【YOLO改进】换遍IoU损失函数之SIoU Loss（基于MMYOLO）

在针对YOLO的改进中，通过替换损失函数常常可以达到“无痛提点”的效果，本文将基于MMYOLO框架介绍如何用SIoU损失函数替换YOLO中常用的CIoU损失函数。

2024-04-29 09:16:55 1274

原创【YOLO改进】换遍IoU损失函数之GIoU Loss（基于MMYOLO）

在针对YOLO的改进中，通过替换损失函数常常可以达到“无痛提点”的效果，本文将基于MMYOLO框架介绍如何用GIoU损失函数替换YOLO中常用的CIoU损失函数。

2024-04-28 10:49:24 1349 1

原创【YOLO改进】主干插入ShuffleAttention模块(基于MMYOLO)

确保 class ShuffleAttention中的输入维度为in_channels(因为MMYOLO会提前传入输入维度参数，所以要保持参数名的一致)修改对应的配置文件，并且将plugins的参数“type”设置为“ShuffleAttention”，可参考。将开源代码ShuffleAttention.py文件复制到mmyolo/models/plugins目录下。修改mmyolo/models/plugins/__init__.py文件。

2024-04-26 08:32:50 696

原创【YOLO改进】主干插入SimAM模块(基于MMYOLO)

确保 class SimAM中的输入维度为in_channels(因为MMYOLO会提前传入输入维度参数，所以要保持参数名的一致)导入MMYOLO用于注册模块的包: from mmyolo.registry import MODELS。修改对应的配置文件，并且将plugins的参数“type”设置为“SimAM”，可参考。将开源代码SimAM.py文件复制到mmyolo/models/plugins目录下。修改mmyolo/models/plugins/__init__.py文件。

2024-04-25 08:18:39 1190 1

原创【YOLO改进】主干插入SKAttention模块(基于MMYOLO)

确保 class SKAttention中的输入维度为in_channels(因为MMYOLO会提前传入输入维度参数，所以要保持参数名的一致)修改对应的配置文件，并且将plugins的参数“type”设置为“BiLevelRoutingAttention”，可参考。导入MMYOLO用于注册模块的包: from mmyolo.registry import MODELS。修改mmyolo/models/plugins/__init__.py文件。

2024-04-24 07:59:51 680

原创【YOLO改进】主干插入TripletAttention模块(基于MMYOLO)

确保 class TripletAttention中的输入维度为in_channels(因为MMYOLO会提前传入输入维度参数，所以要保持参数名的一致)修改对应的配置文件，并且将plugins的参数“type”设置为“TripletAttention”，可参考。将开源代码TripletAttention.py文件复制到mmyolo/models/plugins目录下。修改mmyolo/models/plugins/__init__.py文件。

2024-04-23 08:18:37 1166

原创【YOLO改进】主干插入Spatial Group-wise Enhance(SGE)模块(基于MMYOLO)

确保 class SpatialGroupEnhance中的输入维度为in_channels(因为MMYOLO会提前传入输入维度参数，所以要保持参数名的一致)修改对应的配置文件，并且将plugins的参数“type”设置为“SpatialGroupEnhance”，可参考。导入MMYOLO用于注册模块的包: from mmyolo.registry import MODELS。修改mmyolo/models/plugins/__init__.py文件。

2024-04-22 08:07:14 656 1

原创【YOLO改进】主干插入SequentialPolarizedSelfAttention模块(基于MMYOLO)

确保 class SequentialPolarizedSelfAttention中的输入维度为in_channels(因为MMYOLO会提前传入输入维度参数，所以要保持参数名的一致)修改对应的配置文件，并且将plugins的参数“type”设置为“SequentialPolarizedSelfAttention”，可参考。导入MMYOLO用于注册模块的包: from mmyolo.registry import MODELS。修改mmyolo/models/plugins/__init__.py文件。

2024-04-21 16:28:37 815 1

原创【YOLO改进】换遍主流单阶段检测器主干网络（基于MMYOLO）

【代码】【YOLO改进】换遍主流单阶段检测器主干网络（基于MMYOLO）

2024-04-20 20:30:18 1038

原创【YOLO改进】主干SE模块(基于MMYOLO)

确保 class SEAttention中的输入维度为in_channels(因为MMYOLO会提前传入输入维度参数，所以要保持参数名的一致)导入MMYOLO用于注册模块的包: from mmyolo.registry import MODELS。修改对应的配置文件，并且将plugins的参数“type”设置为“SEAttention”，可参考。将开源代码SE.py文件复制到mmyolo/models/plugins目录下。修改mmyolo/models/plugins/__init__.py文件。

2024-04-19 07:25:14 985

原创【YOLO改进】主干插入S2Attention模块(基于MMYOLO)

确保 class S2Attention中的输入维度为in_channels(因为MMYOLO会提前传入输入维度参数，所以要保持参数名的一致)修改对应的配置文件，并且将plugins的参数“type”设置为“S2Attention”，可参考。将开源代码S2Attention.py文件复制到mmyolo/models/plugins目录下。论文链接: https://arxiv.org/abs/2108.01072。修改mmyolo/models/plugins/__init__.py文件。

2024-04-18 07:17:45 847

原创【YOLO改进】主干插入Parallel Polarized Self Attention模块(基于MMYOLO)

确保 class ParallelPolarizedSelfAttention中的输入维度为in_channels(因为MMYOLO会提前传入输入维度参数，所以要保持参数名的一致)修改对应的配置文件，并且将plugins的参数“type”设置为“ParallelPolarizedSelfAttention”，可参考。导入MMYOLO用于注册模块的包: from mmyolo.registry import MODELS。修改mmyolo/models/plugins/__init__.py文件。

2024-04-17 08:00:37 840

原创【YOLO改进】主干插入ParNetAttention模块(基于MMYOLO)

确保 class ParNetAttention中的输入维度为in_channels(因为MMYOLO会提前传入输入维度参数，所以要保持参数名的一致)修改对应的配置文件，并且将plugins的参数“type”设置为“ParNetAttention”，可参考。将开源代码ParNetAttention.py文件复制到mmyolo/models/plugins目录下。修改mmyolo/models/plugins/__init__.py文件。

2024-04-16 08:08:59 955

原创【YOLO改进】主干插入MHSA（多头注意力机制）模块(基于MMYOLO)

确保 class MHSA中的输入维度为in_channels(因为MMYOLO会提前传入输入维度参数，所以要保持参数名的一致)导入MMYOLO用于注册模块的包: from mmyolo.registry import MODELS。修改对应的配置文件，并且将plugins的参数“type”设置为“MHSA”，可参考。将开源代码MHSA.py文件复制到mmyolo/models/plugins目录下。修改mmyolo/models/plugins/__init__.py文件。

2024-04-15 07:49:19 919 3

原创【YOLO改进】主干插入GatherExcite(GE)模块(基于MMYOLO)

确保 class GatherExcite中的输入维度为in_channels(因为MMYOLO会提前传入输入维度参数，所以要保持参数名的一致)导入MMYOLO用于注册模块的包: from mmyolo.registry import MODELS。修改对应的配置文件，并且将plugins的参数“type”设置为“GatherExcite”，可参考。将开源代码GE.py文件复制到mmyolo/models/plugins目录下。修改mmyolo/models/plugins/__init__.py文件。

2024-04-14 18:06:43 583 1

空空如也

空空如也