自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 即插即用的涨点模块之变体卷积(Ghost卷积)详解及代码,可应用于检测、分割、分类等各种算法领域

来源:CVPR2020官方代码:https://github.com/huawei-noah/ghostnetGhost 模块是一种针对卷积神经网络(CNN)的创新设计,特别适用于嵌入式设备,这些设备通常具有有限的内存和计算资源。Ghost 模块的核心思想是利用已有的特征图(feature maps)通过低成本的线性变换生成更多的“幽灵”特征图(ghost feature maps),从而提高网络的计算效率。

2024-04-21 15:35:57 2039

原创 即插即用的涨点模块之变体卷积(深度可分离卷积)详解及代码,可应用于检测、分割、分类等各种算法领域

来源:CVPR2017深度可分离卷积(Depthwise Separable Convolution)是一种有效的卷积神经网络(CNN)中的卷积操作,主要用于减少模型的计算量和参数数量,同时尽量保持相同的网络性能。这种卷积操作在移动和嵌入式设备上的应用尤为重要,因为这些设备的计算资源有限。深度可分离卷积有mobileNets提出,用于模型的轻量化。

2024-04-21 12:15:13 1040

原创 即插即用的涨点模块之注意力机制(SKAttention)详解及代码,可应用于检测、分割、分类等各种算法领域

SKNet来源:CVPR2019官方代码:什么是感受野?感受野(receptive field)是指在网络的前向传播过程中,每个神经元对输入数据的区域大小。换句话说,它表示了神经元在输入空间中接收信息的范围。在图像处理任务中,神经元的感受野大小通常与输入图像的像素大小有关。较小的感受野可以捕获局部细节,而较大的感受野则可以捕获更大范围的整体结构和语境信息。因此,设计合适大小的感受野对于不同的任务和网络架构至关重要。SKAttention能够根据输入动态选择不同大小的卷积核。

2024-04-20 16:10:07 1551

原创 即插即用的涨点模块之特征融合(TFAM)详解及代码,可应用于检测、分割、分类等各种算法领域

来源:TGRS2023Temporal Fusion Attention Module(TFAM)由作者为孪生网络的变化检测所提出。作者认为卷积增强方法通过应用各种卷积操作增强多尺度和多语义级别的双时相特征,这减少了双时相特征中的噪声干扰。然后,它使用加法、减法或连接来融合双时相特征。注意力增强方法通常在通道维度上连接双时相特征,然后使用注意力机制实现有效融合。然而,卷积增强方法专注于融合前的双时相特征的增强,而注意力增强方法专注于简单融合后的双时相特征的增强。它们都忽略了双时相特征之间的时间信息。

2024-04-20 15:27:17 1036

原创 即插即用的涨点模块之注意力机制(CBAMAttention)详解及代码,可应用于检测、分割、分类等各种算法领域

CE模块通常只注意了通道特征,但在视觉任务中,空间任务通常更为重要,是不可忽略的,因此CBAM将通道注意力机制与空间注意力机制进行串联,充分关注特征信息。什么是空间特征?在深度学习中,空间特征是指描述输入数据在空间维度上的特征信息。对于图像数据而言,空间特征可以涵盖多种信息,包括边缘、角点、纹理、颜色等。这些特征信息可以帮助模型理解图像中不同区域的内容和结构,从而实现诸如目标检测、图像分割、图像分类等任务。

2024-04-19 16:00:15 2760 6

原创 即插即用的涨点模块之特征融合(DFM)详解及代码,可应用于检测、分割、分类等各种算法领域

来源:ISPRS2022Dense fusion module(DFM)由作者为孪生网络的变化检测所提出。双时态特征融合是变化检测的一个关键部分。这一任务难以处理有两个原因:(1)输入到孪生网络中的双时相图像在空间位置和颜色上往往存在偏差。(2)背景对象复杂多变。传统方法使用直接减法或连接来融合特征。不幸的是,尽管孪生网络通过双时像提取特征,但双时像特征之间仍存在很多不对齐的问题。也有许多研究者尝试用注意力机制来解决这个问题。然而,大多数现有的基于注意力的特征模块都会引入大量计算并消耗相当多的内存。

2024-04-19 11:06:45 773 2

原创 即插即用的涨点模块之注意力机制(ECAAttention)详解及代码,可应用于检测、分割、分类等各种算法领域

在SENet中的通道注意模块。具体来说,在给定输入特征的情况下,SE块首先对每个通道单独使用全局平均池化,然后使用两个两个全连接和一个ReLU激活函数,先进行降维在升维,然后使用一个Sigmoid函数来生成通道权值。与SENet相似,但ECANet为了克服性能和复杂性权衡的矛盾,ECANet提出来通过不降维(不降低通道维度)的方法做到只涉及少量参数,但能带来明显的性能增益。在通道上先降维后升维对深度学习模型的作用是什么?通过先降维再升维的操作,来调整模型复杂度和特征表示能力。

2024-04-18 21:11:28 1111 1

原创 即插即用的涨点模块之注意力机制(SEAttention)详解及代码,可应用于检测、分割、分类等各种算法领域

什么是通道特征?通道特征(Channel Features)是指卷积神经网络(CNN)中每个卷积核产生的输出。一个通道对应于网络中的一个卷积核,而每个通道的输出表示该卷积核在输入上的响应。通道特征捕捉了输入数据中不同方面的抽象信息。每个通道对应于某种特定的抽象特征,例如纹理、颜色、边缘等。通道特征在整个网络中负责提取和表示不同层次的信息。什么是通道注意力机制?通道注意力机制(Channel Attention Mechanism)是深度学习中一种用于增强通道特征捕捉能力的注意力机制。

2024-04-18 20:53:00 1700

原创 Pillow(PIL)和OpenCV读取数据的区别

在处理计算机视觉任务过程中,经常会用到Pillow和Opencv来处理数据,本文介绍这两者在处理图片时的不同。

2023-09-20 10:46:37 976 1

原创 视频分类之数据集介绍

本文介绍的为动作识别视频分类数据集。数据集通常通过以下过程构建:1、结合以前数据集的标签,并根据使用情况添加新的类别,从而定义一个新的运动列表。2、从各种来源获取视频,如YouTube和电影,将视频标题/字幕与动作列表匹配。3、手动提供时间注释以指示动作的开始和结束位置。4、通过删除重复数据和过滤来清洗数据集。数据集发布年份数量大小视频长度分类数HMDB5120117K2G5s51UCF101201213.3K6.5G6s101Sports1M20141.1M。

2023-08-22 15:28:01 1269 1

原创 YOLOv7网络结构详细讲解及训练自己数据

YOLOv7是一种优秀的端到端检测算法。YOLOv7由Alexey Bochkovskiy和Chien-Yao Wang等人(YOLOv4团队)于2022年提出。在 5 FPS 到 120 FPS 的范围内,YOLOv7 的速度和准确性都超过了所有已知的物体检测器,在 30 FPS 的所有已知实时物体检测器中,YOLOv7 的准确性最高,达到 56.8% AP。

2023-07-30 15:11:03 9079 1

原创 AnyLabeling自动打标签教程

1、支持多边形,矩形,圆,线和点图像标注。2、通过YOLOv5 和 Segment Anything自动标注。3、支持文本检测,识别和KIE(关键信息提取)标注。4、支持英语,越南语,汉语。一、AnyLabeling安装使用Anaconda安装环境。1、安装环境2、安装anylabeling3、开始使用。

2023-05-15 20:26:13 5814 6

原创 简化YOLOv5的推理过程

模型为YOLOv5s(v7.0)

2023-04-23 15:59:16 1020 1

原创 史上最详细YOLOv5的predict.py逐句讲解

YOLOv5-v7.0将分类脱离出来了。predict.py为分类的推理代码。

2023-04-16 15:49:52 5058 2

原创 PYQT5中QT Designer设置界面、按钮等背景图

超级简单的新手教程。

2023-04-11 22:07:07 2256 2

原创 Error: No such file or directory: “×××.ui“

打开File-settings-Tools-External Tools。其中Working directory换成你现在的UI文件路径。

2023-04-10 21:23:58 616 1

原创 PYQT5的QT Designer工具栏、编辑器消失

PYQT5的QT Designer工具栏、编辑器消失。打开试图,全部勾上。

2023-04-10 21:14:16 930 1

原创 图像分类和图像检测介绍

图像分类和图像检测是计算机视觉中的两个基础任务,它们都是通过对输入的图像进行分析和处理,输出对图像的理解和描述。图像分类是指对一张给定的图像进行分析,并将其分为预定义的一些类别中的一个。这些类别通常是在训练模型时预先定义好的,例如,对于一个识别花卉的分类器,预定义的类别可能包括玫瑰、向日葵、郁金香等。模型需要根据图像的特征将其分为其中一个类别。在实现图像分类的过程中,通常使用监督学习方法。首先,需要收集一些带有标签的数据集,即每个图像都被打上相应的类别标签。

2023-04-10 15:36:47 1352

原创 史上最详细YOLOv5的detect.py逐句注释教程

detect.py主要有run(),parse_opt(),main()三个函数构成。

2023-04-10 15:36:28 10875 9

原创 FastestDet训练自己的数据集

本文介绍了如何利用FastestDet训练自己数据集。

2023-03-29 15:16:29 2064 10

原创 AttributeError: module ‘numpy‘ has no attribute ‘float‘

出现这个问题的原因是:从numpy1.24起删除了numpy.bool、numpy.int、numpy.float、numpy.complex、numpy.object、numpy.str、numpy.long、numpy.unicode类型的支持。

2023-03-28 10:42:47 15574 8

原创 VOC格式转换为YOLO格式

<bndbox></bndbox>

2023-03-27 15:54:49 488 1

原创 YOLO格式转换为VOC格式

<bndbox></bndbox>

2023-03-27 15:22:54 620

该代码介绍了如何将YOLO格式转换为XML格式

该代码介绍了如何将YOLO格式转换为XML格式

2023-03-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除