自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 YOLOv5改进 | 一文汇总:如何在网络结构中添加注意力机制、C3、卷积、Neck、SPPF、检测头

为了进一步提升YOLOv5的性能,研究人员提出了多种改进策略,包括注意力机制、C3模块、卷积改进、Neck改进、SPPF模块、检测头改进等。本文将对这些改进策略进行综述,介绍其原理、应用场景、算法实现、代码示例、部署测试方法、文献资料、应用案例、总结、影响和未来扩展方向等。C3模块是一种用于特征提取的网络结构,它能够融合不同尺度的特征,从而提升模型对小目标的检测能力。SPPF模块是一种用于多尺度特征融合的网络结构,它可以提取不同尺度的特征并进行融合,从而提升模型对多尺度目标的检测能力。

2024-05-24 21:31:37 869

原创 特征融合篇 | 结合内容引导注意力 DEA-Net 思想 实现双主干特征融合新方法 | IEEE TIP 2024

本篇介绍了一种基于细节增强注意力块(DEAB)的双主干特征融合新方法,该方法在 IEEE TIP 2024 上发表。该方法将内容引导注意力机制与细节增强卷积相结合,有效地融合了来自不同尺度的特征,显著提升了单幅图像去雾性能。该方法将内容引导注意力机制与细节增强卷积相结合,有效地融合了来自不同尺度的特征,显著提升了单幅图像去雾性能,在 IEEE TIP 2024 上得到了认可。

2024-05-23 22:32:37 615

原创 改进YOLOv5 | 在 C3 模块中添加【SimAM】【CoTAttention】【SKAttention】【DoubleAttention】注意力机制

YOLOv5 是一个强大的目标检测模型,在 COCO 数据集上取得了 state-of-the-art 的结果。为了进一步提高 YOLOv5 的性能,本文提出了一种改进方案,在 C3 模块中添加 SimAM、CoTAttention、SKAttention 和 DoubleAttention 注意力机制。

2024-05-09 12:14:14 735

原创 特征融合篇 | YOLOv8 (ultralytics) 实现 YOLOv9 辅助可逆分支架构 | 附训练推理结构图 RepNCSPELAN4/ADown/SPPELAN/train/val

YOLOv9是Ultralytics公司于2023年4月推出的最新一代目标检测算法,在YOLOv8的基础上进行了诸多改进,包括引入了辅助可逆分支架构(Auxiliary Reversible Branch Architecture,ARBA)。ARBA通过引入可逆分支,增强了特征提取能力,提升了模型的性能。YOLOv9是一款功能强大、性能优异的目标检测算法,具有广阔的应用前景。ARBA的引入进一步提升了YOLOv9的性能,使其在目标检测领域取得了新的突破。

2024-05-27 21:13:52 885

原创 YOLOv5/v7 引入 YOLOv8 的 C2f 模块

YOLOv8 是 Ultralytics 团队于 2022 年 10 月发布的最新一代目标检测模型。YOLOv8 在 YOLOv7 的基础上进行了多项改进,包括引入 C2f 模块、改进 Path Aggregation Network (PAN) 结构、优化 Label Assigning 算法等。C2f 模块是 YOLOv8 中引入的主要创新之一。C2f 模块是一种轻量级的特征融合模块,可以有效提高模型的性能。

2024-05-26 00:15:00 517 1

原创 YOLOv5/v7 引入 RepVGG 重参数化模块

RepVGG 是由 Megvii Research 团队于 2021 年提出的深度卷积神经网络架构,它通过重参数化 VGGNet 架构,显著提高了模型的性能和效率。RepVGG 架构在 YOLOv5 和 YOLOv7 等目标检测模型中得到了广泛应用,进一步提升了模型的精度和速度。

2024-05-25 00:00:00 1338 1

原创 YOLOv5/v7 应用轻量级通用上采样算子CARAFE

CARAFE(Content-Aware ReAssembly of FEatures)是一种轻量级的通用上采样算子,它可以用于提高卷积神经网络(CNN)中特征图的分辨率。CARAFE 的特点是计算量小、参数少、易于实现,因此非常适合用于移动端和嵌入式设备上的 CNN 模型。CARAFE 是一种轻量级的通用上采样算子,它具有计算量小、参数少、易于实现等优点,可以有效提高 CNN 模型的性能。

2024-05-23 22:41:56 520 1

原创 YOLOv8官方推荐免费数据集网站Roboflow数据预处理教程

Roboflow是一个免费的数据标注和预处理平台,提供多种工具和功能,可以帮助用户快速高效地完成数据预处理工作。Roboflow平台提供了多种数据标注工具,包括自动标注、手动标注和协作标注等,可以帮助用户快速完成数据标注工作。Roboflow平台是一个功能强大、易于使用的免费数据预处理平台,可以帮助用户快速高效地完成YOLOv8模型的数据预处理工作。Roboflow平台的出现降低了目标检测模型训练和部署的门槛,使更多人能够轻松使用YOLOv8等先进的模型进行目标检测任务。

2024-05-23 22:29:05 531

原创 即插即用篇 | YOLOv8 引入 SimAM 注意力机制 | 《SimAM: A Simple, Parameter-Free Attention Module for Convolutional》

SimAM(Simple Attention Module)是一种简单、无参数的注意力机制,可用于卷积神经网络(CNN)。与其他注意力机制不同,SimAM 不需要引入额外的参数,因此计算成本更低、部署更方便。SimAM 已被证明可以有效提高 CNN 的性能,特别是在目标检测任务中。YOLOv8 是 Ultralytics 公司于 2022 年 8 月推出的最新一代目标检测算法。YOLOv8 在 YOLOv5 的基础上进行了大量改进,包括引入了 SimAM 注意力机制。

2024-05-21 07:30:00 56

原创 YOLOv8融入低照度图像增强算法---传统算法篇

本篇介绍将传统算法融入 YOLOv8 目标检测算法,以增强低照度图像的目标检测性能。传统算法包括直方图均衡化、锐化、去噪等,能够有效提升低照度图像的质量,为目标检测提供更清晰的输入。该方法将传统算法融入 YOLOv8 目标检测算法,能够有效增强低照度图像的目标检测性能,在夜间、暗光等条件下也能获得较好的检测结果。

2024-05-20 21:11:48 249

原创 YOLOv8小白中的小白安装环境教程!没一个字废话,看一遍不踩坑!

YOLOv8是Ultralytics公司于2022年8月推出的最新一代目标检测算法,以其速度快、精度高、易部署等特点迅速成为业界新宠。引入了新的CSPNet骨干网络,使模型更轻量化、更快速。采用了新的Path Aggregation Network (PAN) 结构,增强了特征提取能力。改进了头部的预测机制,提高了检测精度。YOLOv8是一款速度快、精度高、易部署的目标检测算法,具有广阔的应用前景。随着人工智能技术的发展,YOLOv8也将不断改进和完善,为人们的生活带来更多便利。

2024-05-20 08:00:00 634

原创 改进YOLO系列 | YOLOv5/v7 引入通用高效层聚合网络 GELAN | YOLOv9 新模块

GELAN通过SE模块增强特征表达能力,利用CA模块捕获全局信息,利用SA模块捕获局部信息,并通过FPN模块融合多尺度特征,最终提升模型性能。GELAN是一种通用高效的层聚合网络,可广泛应用于各类视觉任务,并取得了显著的性能提升。GELAN的提出,推动了视觉模型架构设计的创新,为相关领域研究提供了新的思路和方法。未来,GELAN将持续改进,并探索在更多领域中的应用,例如视频理解、医学影像分析等。GELAN已应用于YOLOv9目标检测框架中,并取得了显著的性能提升。

2024-05-18 18:19:01 250

原创 YOLOv8 如何实现多主干特征融合方式 | GhostNet+ShuffleNet / SwinTransformer+ShuffleNet

未来可以探索更多类型的轻量级主干网络,如 MobileNetV3、EfficientNet 等,并尝试将它们与 SwinTransformer 或其他高性能网络进行融合,进一步提升 YOLOv8 在移动端的性能和部署效果。通过将不同类型的轻量级主干网络组合,可以充分利用各自的优势,提升模型的特征提取能力和推理效率。YOLOv8 采用多主干特征融合的方式,可以有效提升目标检测的性能。多主干特征融合技术可以显著提升 YOLOv8 在资源受限设备上的目标检测性能,为智能设备的应用场景提供了更多可能性。

2024-05-17 14:10:34 698

原创 nvidia nccl安装和测试的实战教程

是用于高性能 GPU 集群通信的库,能够显著提升深度学习训练和推理中的通信效率。NCCL 支持多种通信模式,包括全Reduce、All-Gather、Broadcast 等,并提供高效的点对点通信原语。NVIDIA NCCL 是用于高性能 GPU 集群通信的库,能够显著提升深度学习训练和推理中的通信效率。NCCL 支持多种通信模式,并提供高效的点对点通信原语,使其成为分布式深度学习应用中的重要工具。

2024-05-17 08:15:00 843

原创 人工智能-深度学习-PyTorch数据读取实战【含详细源代码+数据集+图示分析】

在深度学习任务中,数据读取是至关重要的一环。它影响着模型的训练速度和训练效果。本文将以PyTorch框架为例,介绍如何读取RMB人民币二分类数据集,并进行详细的代码解析和图示分析。本文介绍了PyTorch框架下如何读取RMB人民币二分类数据集,并提供了详细的代码解析和图示分析。希望对您有所帮助。

2024-05-16 06:30:00 153

原创 huggingface datasets离线加载文件的解决方案

Hugging Face Datasets是一个用于加载和处理自然语言处理(NLP)和计算机视觉(CV)数据集的库。它提供了一种统一的API来访问各种数据集,包括来自Hugging Face Hub、本地文件和远程URL。然而,在离线环境中,直接从远程URL加载数据集可能无法实现。为了解决这个问题,Hugging Face Datasets提供了离线加载文件的解决方案,允许用户从本地文件加载数据集。

2024-05-15 00:35:53 1424

原创 主干网络篇 | YOLOv5/v7 更换骨干网络之 HGNetv2 | 百度新一代超强主干网络

HGNetv2 是百度于 2022 年发布的全新一代超强主干网络,在 ImageNet 数据集上取得了 state-of-the-art 的结果。本文介绍如何将 HGNetv2 作为骨干网络应用于 YOLOv5 和 YOLOv7 目标检测模型,以提升模型性能。

2024-05-15 00:33:32 642

原创 高速下载b站视频的解决方案

B站(哔哩哔哩)是中国大陆一个知名的视频分享网站,拥有海量的视频资源。然而,B站官方提供的视频下载功能通常速度较慢,且存在一些限制。因此,许多用户寻求第三方工具或方法来高速下载B站视频。B站视频下载的需求广泛存在,但需要注意的是,下载B站视频可能违反B站的服务条款,请谨慎使用。建议您使用官方提供的下载功能或付费购买视频版权。

2024-05-14 08:00:00 544

原创 YOLOv5性能评估指标->mAP、Precision、Recall、FPS、Confienc (讲解论文关注的主要指标)

YOLOv5性能评估指标是衡量目标检测模型性能的重要工具,其发展推动了YOLOv5模型的不断改进和应用范围的扩展。未来,随着研究的深入和技术的进步,YOLOv5性能评估指标将更加完善和高效,为目标检测模型的开发和应用提供更加有效的指导。mAP(Mean Average Precision)是衡量目标检测模型整体性能的常用指标,它综合考虑了模型的查全率(Recall)和准确率(Precision)。mAP值越高,表明模型性能越好。Precision衡量的是模型预测为正类的框中,实际为正类的比例。

2024-05-12 08:00:00 952

原创 RuntimeError: expected scalar type Half but found Float解决方案

这种数据类型不匹配可能发生在模型推理、损失计算或优化器更新等各种操作期间。通过仔细检查数据类型、必要时进行数据转换以及利用适当的工具和技术,您可以有效地解决。某些优化器和损失函数可能需要特定配置或调整才能与半精度数据一起使用。确定哪个操作或函数导致了错误。这可能涉及检查代码或使用调试工具。这可能涉及设置模型参数或使用支持半精度特定模型构建器。等工具来识别与数据类型不匹配相关的潜在问题。采用混合精度训练技术,在某些操作中保持。确保传递给操作的数据类型为预期的。错误,并确保您的模型顺利运行。

2024-05-11 21:00:00 246

原创 transformers加载模型时自动选择空闲的单个GPU的实战代码

Transformers 已经彻底改变了自然语言处理 (NLP) 任务,在各种应用中取得了卓越的性能。但是,训练和运行这些模型通常需要大量的计算资源,尤其是 GPU。有效的 GPU 利用率对于最大限度地提高性能和降低成本至关重要。这正是自动 GPU 选择发挥作用的地方。自动 GPU 选择是一种优化 GPU 利用率和提高 Transformers 模型性能的宝贵技术。通过动态识别和分配空闲 GPU,这种方法可确保每个模型都具有必要的计算资源,而不会过载系统。

2024-05-11 12:01:57 997

原创 NVIDIA NCCL 安装和测试实战教程

ibrary)是用于深度学习应用的高性能通信库,可加速多GPU通信和同步。它能够在多个GPU之间进行高效的数据传输和集体操作,显著提高了分布式GPU系统上深度学习训练和推理的性能。NVIDIA NCCL是加速多GPU系统上深度学习应用的必不可少的工具。其高效的通信原语和集体操作显著提高了分布式训练和推理的性能,使其成为现代深度学习基础架构的关键组成部分。

2024-05-11 08:00:00 777

原创 YOLOv8官方推荐免费数据集网站Roboflow数据增强教程

Roboflow是一个免费的数据标注和预处理平台,提供多种工具和功能,可以帮助用户快速高效地完成数据预处理工作。Roboflow平台提供了多种数据标注工具,包括自动标注、手动标注和协作标注等,可以帮助用户快速完成数据标注工作。Roboflow平台是一个功能强大、易于使用的免费数据预处理平台,可以帮助用户快速高效地完成YOLOv8模型的数据预处理工作。Roboflow平台的出现降低了目标检测模型训练和部署的门槛,使更多人能够轻松使用YOLOv8等先进的模型进行目标检测任务。

2024-05-10 20:00:00 133

原创 YOLOv5改进 | 图像去雾 | MB-TaylorFormer改善YOLOv5高分辨率和图像去雾检测

通过将 MB-TaylorFormer 模块嵌入 YOLOv5 的骨干网络中,模型可以更好地捕捉图像的全局特征和细节信息,从而增强其在高分辨率图像和模糊图像上的目标检测能力。为此,本文提出了一种基于 MB-TaylorFormer 的 YOLOv5 增强模型(MB-TaylorFormer-YOLOv5),旨在提升模型在高分辨率和图像去雾场景下的目标检测性能。MB-TaylorFormer-YOLOv5 模型的实现主要涉及将 MB-TaylorFormer 模块嵌入 YOLOv5 的骨干网络中。

2024-05-10 12:07:12 182

原创 主干网络篇 | YOLOv5/v7 更换骨干网络之 HGNetv2 | 百度新一代超强主干网络

CSP Ghost Module 是 HGNetv2 的核心模块之一,它将深度卷积拆解为多个浅层卷积,并采用逐层融合策略,提升模型性能和效率。HGNetv2作为百度新一代超强主干网络,在性能和效率方面取得了显著提升,可广泛应用于各类视觉任务。HGNetv2的提出,推动了视觉骨干网络技术的发展,为相关领域研究提供了新的思路和方法。未来,HGNetv2将持续改进,并探索在更多领域中的应用,例如视频理解、医学影像分析等。相信在未来,HGNetv2将发挥更大的作用,为人工智能技术发展做出更大的贡献。

2024-05-10 09:00:00 466

原创 A100 GPU服务器安装CUDNN教程

CUDNN(NVIDIA CUDA Deep Neural Network Library)是NVIDIA提供的深度学习加速库,可以显著提高深度学习模型在NVIDIA GPU上的运行速度。A100 GPU服务器通常配备了高性能的NVIDIA GPU,因此安装CUDNN可以充分发挥A100 GPU的计算能力,提升深度学习应用的性能。

2024-05-10 06:00:00 15

原创 V100 GPU服务器安装GPU驱动教程

V100 GPU服务器是高性能计算领域的强大工具,可以用于机器学习、深度学习、科学计算等各种应用。为了充分发挥 V100 GPU 的性能,需要安装相应的驱动程序。

2024-05-10 02:15:00 7

原创 A100 GPU服务器安装CUDA教程

CUDA(Compute Unified Device Architecture)是NVIDIA开发的并行计算平台,允许程序员利用GPU进行通用计算。在A100 GPU服务器上安装CUDA可以释放A100 GPU强大的计算能力,用于深度学习、科学计算、数据分析等各种任务。

2024-05-09 21:12:50 723

原创 如何检验下载的大模型checkpoint文件是否正确的解决方案

哈希值是一种将任意长度的输入转换为固定长度的输出的函数,具有单向性(无法从哈希值反推出原始数据)和碰撞性(相同输入产生相同哈希值的概率极低)的特点。随着大型模型的日益普及,校验下载的大模型checkpoint文件的需求也将不断增长。校验下载的大模型checkpoint文件是使用大型模型之前的重要步骤,可以有效避免因文件损坏导致的模型无法加载或运行错误等问题。校验下载的大模型checkpoint文件可以提高模型使用的可靠性和稳定性,避免因文件损坏导致的各种问题,从而提升用户体验和降低维护成本。

2024-05-09 20:51:43 102

原创 UE5、CesiumForUnreal实现建筑白模生长动画效果

利用UE5和CesiumForUnreal插件,可以实现建筑白模的生长动画效果,直观展示建筑的建设过程。

2024-05-09 11:00:00 913

原创 高速下载VisualGLM模型文件的解决方案

此外,采用静态下载技术也可以有效避免下载过程中出现的速度波动问题,保障下载的稳定性。高速下载 VisualGLM 模型文件的解决方案是 VLP 领域的重要工具,可以有效提高 VisualGLM 模型的下载速度,降低用户的获取成本。当然,我们还需要注意到分块下载可能带来的版本控制和合并的问题,需要谨慎处理。在下载 VisualGLM 模型文件的过程中,必须确保文件的安全性。高速下载 VisualGLM 模型文件的解决方案将为 VLP 领域的发展提供强有力的支持,助力 VLP 技术更加普惠、高效和智能。

2024-05-09 08:00:00 400

原创 A100 GPU服务器安装GPU驱动教程

A100 GPU服务器是NVIDIA推出的高性能计算服务器,搭载了A100 GPU芯片,拥有强大的计算能力。为了充分发挥A100 GPU的性能,需要安装相应的驱动程序。通过正确安装和配置A100 GPU服务器的驱动程序,可以充分发挥A100 GPU的强大性能,助力用户在人工智能、高性能计算、数据中心等领域取得成功。A100 GPU服务器的驱动程序将不断发展,为用户提供更强大的GPU计算能力和更丰富的功能,助力用户在各个领域取得更大的成功。A100 GPU服务器的驱动程序是A100 GPU发挥性能的关键。

2024-05-08 23:59:30 381

原创 高速下载ChatGLM模型文件的解决方案

此外,采用静态下载技术也可以有效避免下载过程中出现的速度波动问题,保障下载的稳定性。高速下载 ChatGLM 模型文件的解决方案是 NLP 领域的重要工具,可以有效提高 ChatGLM 模型的下载速度,降低用户的获取成本。如果ChatGLM模型文件体积较大,我们可以考虑将其拆分成较小的分块,然后分块下载。在下载ChatGLM模型文件的过程中,必须确保文件的安全性。高速下载 ChatGLM 模型文件的解决方案将为 NLP 领域的发展提供强有力的支持,助力 NLP 技术更加普惠、高效和智能。

2024-05-08 23:21:59 385

原创 高速下载ChatGLM2模型文件的解决方案

此外,采用静态下载技术也可以有效避免下载过程中出现的速度波动问题,保障下载的稳定性。高速下载 ChatGLM2 模型文件的解决方案是 NLP 领域的重要工具,可以有效提高 ChatGLM2 模型的下载速度,降低用户的获取成本。如果 ChatGLM2 模型文件体积较大,我们可以考虑将其拆分成较小的分块,然后分块下载。在下载 ChatGLM2 模型文件的过程中,必须确保文件的安全性。高速下载 ChatGLM2 模型文件的解决方案将为 NLP 领域的发展提供强有力的支持,助力 NLP 技术更加普惠、高效和智能。

2024-05-08 23:10:55 540

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除