自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(114)
  • 收藏
  • 关注

原创 PyTorch导出ONNX格式分割模型及在C#中调用预测

摘要 本文介绍了PyTorch模型导出为ONNX格式并在C#中调用的完整流程。首先概述了ONNX作为跨框架中间表示的作用,重点讲解了PyTorch模型导出ONNX的关键步骤:加载权重、切换推理模式、构造输入张量等。针对常见的adaptive_avg_pool2d导出失败问题,详细分析了三种解决方案,最终通过替换为avg_pool2d成功解决。文章还提供了完整的在C#中调用onnx模型进行分割预测的代码示例和参数说明,为跨平台部署深度学习模型提供了实用指导。

2026-02-16 21:33:39 952

原创 目标识别精度指标与IoU及置信度关系辨析

本文系统阐述了目标识别中的精度指标及其相互关系。首先介绍了目标识别的基本概念和两大流派(一阶段与两阶段方法)。重点分析了影响识别精度的两个关键阈值参数:置信度阈值(决定预测框可靠性)和IoU阈值(衡量预测框与真实框的重合度)。详细讲解了精确率(precision)、召回率(recall)、F1-score等基础指标的计算方法和相互关系。特别深入探讨了mAP指标,包括AP的计算原理(PR曲线积分)、Python实现代码,以及不同IoU阈值下的mAP变体(如mAP50、mAP75和mAP50-95)。

2026-02-08 22:23:45 943

原创 YOLOv26原理分析及训练评估实战代码

YOLOv26是Ultralytics团队2025年发布而26年开源的物体检测模型,本文详细介绍了yolov26的原理和改进点,并给出了训练评估代码。该模型提供n/s/m/l/x五种规模,在MSCOCO数据集上性能表现优异,尤其在l/x规模下mAP50-95显著提升(最高57.5)。相比前代YOLOv11-v13,v26在保持参数量相近的同时降低了计算量,并引入端到端模式(end2end)以提升推理速度。训练方面支持多种数据增强技术,通过修改yaml配置文件即可适配不同数据集。

2026-01-27 22:55:26 1191

原创 通信与网络基础知识简记

本文总结了通信与网络基础知识要点:1) 通信信道带宽定义在不同领域存在差异,无噪声信道容量采用奈奎斯特公式计算,有噪声信道采用香农公式;2) 通信方式分为单工、半双工和全双工,所需信道数量不同;3) 对比了OSI七层模型与TCP/IP四层模型结构;4) 介绍了有线传输介质(同轴电缆、双绞线、光纤)的特性与区别;5) 分析了交换机(二层/三层)和路由器的工作原理及差异;6) 列举了常见网络协议及其所属网络层次。文章系统梳理了网络通信的核心概念与技术要点。

2026-01-19 22:26:31 610

原创 软件开发中面向对象技术的23种设计模式简介

本文系统介绍了面向对象设计中的23种经典设计模式,分为创建型、结构型和行为型三大类。创建型模式(5种)如单例、工厂方法等,专注于对象创建机制;结构型模式(7种)如适配器、装饰器等,处理类和对象的组合;行为型模式(11种)如观察者、策略等,解决对象间交互问题。每种模式都配有定义说明和典型应用场景示例,如工厂方法实现饮品生产、观察者模式模拟消息订阅等。这些模式为解决特定软件开发问题提供了可复用的解决方案,能有效提高代码复用性和系统灵活性。

2026-01-14 21:57:50 654

原创 火焰烟雾图像数据集汇总分享

本文汇总了多个公开可用的火焰与烟雾图像数据集,涵盖目标识别、分类和分割任务。主要数据集包括:FASDD(最大通用数据集,含9.5万张图)、飞浆平台4个数据集(共约6万张图,部分含增强图片)、D-Fire(2.1万张图)、DFS(9千张图)以及IEEE_FLAME(4.8万张航拍图)。各数据集在场景多样性(室内/户外/航拍)、图片数量(1千-9.5万)、标签格式(YOLO/VOC/COCO)和文件大小(0.7G-11.5G)方面差异显著,部分数据集存在数据增强或重复图片需注意。这些资源可为火灾检测研究提供数据

2026-01-04 22:52:34 1465

原创 YOLOv13结合代码原理详细解析及模型安装与使用

YOLOv13是目标检测领域的最新进展,在YOLOv12基础上引入了基于超图的自适应相关性增强机制,显著提升了全局特征提取能力。该模型延续YOLO系列单阶段检测的高效特性,提供N/S/L/X四种规模,在MSCOCO数据集上展现出优异的精度-速度平衡。安装时需注意PyTorch 2.x环境和相关依赖包配置,训练代码简洁易用,支持多种数据增强策略。本文详细介绍了YOLOv13模型的原理及结构,结合代码进行了解析,并介绍了模型如何安装与使用。

2025-12-30 10:43:27 1184

原创 YOLOv11与v12与v13检测精度对比及实战训练代码

本文对比了YOLOv11、v12、v13的目标检测性能,并提供了实战训练代码。首先介绍了YOLO的发展历程,从2015年v1到2025年v13共13个版本。重点分析了v11的C3K2模块、v12的区域注意力机制和v13的超图结构在MSCOCO数据集上的表现。实验使用VOC2007数据集,在RTX4090显卡上分别测试了不同优化器和训练参数下的模型性能,提供了完整的训练代码和常见问题解决方案。

2025-12-14 21:40:04 840

原创 YOLOv12模型安装及原理和代码解析

YOLOv12是2025年提出的最新目标检测模型,属于YOLO系列的第12代版本。该模型采用注意力机制替代传统CNN结构,显著提升了特征表达能力。文章详细介绍了YOLO系列的发展历程,从v1到v13的各版本特点及创新点。在安装部分,重点说明了YOLOv12的环境配置要求(Python 3.11、Torch 2.2.2)和安装流程,特别强调了优化注意力机制效率的flash_attn包的安装注意事项。最后结合源代码对YOLOv12的原理和结构进行解析说明。

2025-12-11 14:54:05 960

原创 YOLOv11结构解析及源码复现

YOLOv11是Ultralytics团队2024年提出的最新目标检测模型,延续YOLO系列单阶段检测架构,引入C3K2模块和free-anchor技术。文章系统梳理了YOLO发展历程,对比一阶段与两阶段检测方法差异,详细解析YOLOv11的三段式结构(Backbone、Neck、Head)。针对官方源码复杂度高的问题,推荐使用第三方Pytorch实现版本(YOLOv11-pt),提供模型结构清晰解读和简化复现方案。该模型支持目标检测、分类、分割等多任务。

2025-12-07 22:49:31 1157

原创 基于python代码对SIFT算法的超长详细解析

SIFT算法是一种经典的图像特征提取算法,具有尺度、旋转不变性和强鲁棒性。该算法通过构建高斯金字塔尺度空间,在不同尺度下检测关键点。主要步骤包括:1)生成多尺度高斯模糊图像;2)通过DOG运算检测极值点;3)精确定位关键点并去除噪声和边缘响应。算法输出128维特征向量,可用于图像匹配等任务。专利已于2020年到期,现可自由使用。本文结合Python开源项目详细解析了SIFT算法的实现原理和代码结构,包括高斯金字塔构建、关键点检测等核心步骤。

2025-12-02 17:03:58 637

原创 模拟退火算法求解聚类问题python代码示例

摘要:本文介绍了模拟退火算法在模糊C-均值聚类(FCM)问题中的应用。模拟退火是一种基于热力学退火过程的智能优化算法,能够有效避免传统FCM算法对初始值敏感的缺点。文章首先概述了智能优化算法和模拟退火原理,然后详细描述了聚类问题和FCM算法特点。针对400个二维数据点的4类聚类问题,提供了完整的Python实现代码,包括数据生成、目标函数计算、遗传算法交叉变异等关键步骤,展示了如何结合智能算法提高聚类效果。该方案适用于需要全局优化的组合问题求解。

2025-11-19 22:40:42 1275 1

原创 蚁群算法求解二维最佳路径python代码实战

蚁群算法是一种模拟蚂蚁觅食行为的智能优化算法,通过信息素正反馈机制寻找最优路径。本文以二维路径规划为例,首先基于MAKLINK图论构建无向网络图,将路径端点离散化为蚁群搜索空间。算法实现包括距离矩阵计算和信息素更新,通过Python代码求解起点(20,180)到终点(160,90)的最短路径,同时避让4个多边形障碍物。实验过程先用Dijkstra算法获取初始路径,再用蚁群算法进行优化搜索,最终输出二维环境下的最优避障路径,给出了完整的python实现代码。

2025-11-14 20:07:15 1714

原创 遗传算法求解TSP旅行商问题python代码实战

本文介绍了遗传算法求解TSP旅行商问题的Python实现。遗传算法是一种模拟自然选择过程的智能优化算法,通过模拟基因遗传和变异来寻找近似最优解。TSP问题属于NP难问题,遗传算法能有效获得次优解。文章详细阐述了遗传算法原理、TSP问题定义及求解难点,并提供了14个城市坐标的Python实现代码。代码包括种群初始化、适应度计算、交叉变异等核心操作,通过可视化展示优化过程。这种方法虽不能保证全局最优,但在计算效率和求解质量间取得了较好平衡,适用于大规模组合优化问题。

2025-11-12 22:33:01 859

原创 粒子群算法求解函数最值python代码示例

本文介绍了粒子群算法(PSO)及其在求解函数最值问题中的应用。PSO是一种模拟鸟群、鱼群等群体行为的智能优化算法,通过粒子间协作在搜索空间中寻找最优解。文中给出了Python实现代码,使用PSO算法求解(-2,2)区间内特定函数的最大值。代码包含粒子初始化、速度更新、位置更新等关键步骤,并设置了种群规模、学习因子、速度限制等参数。实验结果表明该算法能有效找到函数在给定区间内的最大值。

2025-10-05 23:47:17 921

原创 禁忌搜索算法求解31个城市TSP旅行商问题python代码

本文介绍了使用禁忌搜索算法求解31个城市TSP问题的Python实现。TSP问题要求找到经过所有城市的最短路径,属于NP难问题。禁忌搜索是一种智能优化算法,通过禁忌表避免局部最优陷阱,允许接受次优解以寻求全局最优。文章提供了31个城市坐标数据,并详细说明了算法实现步骤:包括生成距离矩阵、初始化路径、计算总距离、邻域搜索等核心函数。代码通过随机交换城市位置产生邻域解,利用禁忌表避免重复搜索,在多次迭代中寻找最优路径。该算法能有效求解大规模TSP问题,虽然不保证全局最优,但能快速获得高质量解。

2025-10-05 23:00:25 646

原创 快速傅里叶变换分析频谱详解及python代码示例

本文介绍了快速傅里叶变换(FFT)在频谱分析中的应用。通过Python代码示例,演示了如何生成复合频率信号(50Hz、70Hz、90Hz正弦波叠加)并进行FFT频谱分析。关键点包括:使用numpy的fft函数计算频谱,需对结果取绝对值并归一化;频谱具有共轭对称性,只需分析前半部分;增加采样时间可使频谱更接近理想脉冲形状。实验结果验证了FFT能准确识别信号频率成分及其振幅(如70Hz信号的振幅为2)。文章还提供了完整代码和不同采样时间下的频谱对比图。

2025-09-30 21:10:02 1264

原创 快速傅里叶变换简介及python实现

本文介绍了快速傅里叶变换(FFT)的Python实现。首先概述了傅里叶变换的基本理论,包括傅里叶级数、连续/离散傅里叶变换及其数学表达式。重点阐述了FFT算法原理,通过蝶形运算将复杂度降至对数级别。文章提供了一个基于递归的基2FFT算法Python实现,包含核心的butterfly函数完成蝶形运算。该实现虽效率低于标准库函数,但更直观展示算法原理,要求输入序列长度为2的幂次。代码采用复数运算实现时间抽取的FFT计算过程,有助于理解FFT的核心思想。

2025-09-30 17:03:05 1032

原创 UltraLight-VM-UNet训练自建数据集

UltraLight-VM-UNet是一种轻量级医学图像分割网络,融合UNet架构与Mamba模型,参数量仅0.049M。该模型采用并行视觉Mamba层降低计算负载,结合注意力桥接模块提升分割性能。安装需配置Python≥3.8、PyTorch≥1.13及Mamba-SSM依赖。训练过程包括数据集准备、生成训练集、超参数设置等步骤,支持使用预训练权重。测试表明该模型在皮肤病数据集上表现优异,适用于医学影像分割任务。相关代码和论文已开源,为研究者提供了便捷的实现方案。

2025-09-24 21:09:24 1175

原创 AutoDL平台使用进阶技巧

摘要: 本文介绍了AutoDL平台的使用进阶技巧,重点解决本地算力不足时租用显卡的需求。主要涵盖文件传输与代码编辑两方面: 文件传输:支持本地与平台间通过Filezilla(推荐)或网页端传输,后者适合临时使用;平台内部实例间可通过中转站传输,但限于同地区,免费空间20G。 代码编辑:提供终端命令(如vim)、本地编辑上传和网页编辑三种方式,推荐网页端直接修改(类Notepad操作),避免频繁上传。 AutoDL平台操作灵活,适合高效管理深度学习任务。

2025-09-16 21:04:38 1025

原创 树莓派32位与64位系统安装teamviewer远程软件

本文介绍了在树莓派32位和64位系统上安装TeamViewer远程控制软件的方法。树莓派作为ARM架构微型计算机,可通过CSI接口连接摄像头、GPIO引脚控制外部元件。64位系统安装较简单,直接下载arm64.deb包即可;而32位系统需额外安装依赖包并更换软件源,安装后仅支持被控功能。相比VNC和官方Raspberry Pi Connect,TeamViewer支持外网远程且流畅度高。安装完成后,64位系统可双向控制,32位系统仅限被控端。文中详细提供了系统版本查询方法、软件下载链接和具体安装步骤。

2025-09-08 19:33:54 996

原创 电磁波成像(X射线、CT成像)原理简介

本文介绍了多种图像成像方式及其原理。可见光成像是人眼和相机通过感知物体反射光形成的,涉及电磁波波长与颜色关系。X射线成像利用物体对X射线的不同衰减特性,广泛应用于医学和工业领域。CT成像通过多方向X射线扫描重建物体内部结构,比X射线成像信息更丰富。PET成像则通过检测正电子湮灭产生的伽马射线,获取人体功能代谢信息。这些成像技术在医疗诊断、工业检测等领域发挥着重要作用,各具特点且互补使用。

2025-09-05 19:48:43 1101

原创 大批量文件管理操作的linux与windows系统命令行终端命令

本文对比了Linux和Windows系统下大批量文件管理的命令行操作,包括文件夹创建、文件移动、删除及压缩解压功能。在Linux系统中,文件操作数量受命令行参数长度限制(约5万个文件),需使用find命令处理大批量文件;而Windows PowerShell则能处理更多文件(约40万个)。文章详细介绍了两种系统下创建嵌套文件夹、移动/删除大批量文件以及压缩解压的具体命令和注意事项。特别强调了Windows PowerShell与Linux终端在参数使用和功能限制上的差异。

2025-09-02 16:08:59 1167

原创 目标检测数据集转换为图像分类数据集

本文主要介绍了如何将目标检测数据集转换为图像分类数据集,并且以yolo数据集为例,给出了完整的转换代码,最后还给出了通用的图像分类任务的训练代码。

2025-08-22 17:53:39 703

原创 AIGC之StableDiffusion安装与运行详细介绍

本文详细介绍了StableDiffusion这一根据文本生成图像的模型,以及它的两种功能用途,并且给出了详细的安装过程说明,以及图像修复的代码,最后展示了图像修复的效果。

2025-08-22 17:45:12 946

原创 30秒处理1万张图片——图像数据增强的高效执行代码

本文探讨了高效图像数据增强方法,以添加椒盐噪声为例,逐步优化代码执行效率。初始的逐像素循环方法处理1万张图片需7分钟;改用numpy向量化操作后缩短至1分钟;尝试GPU加速反增耗时至2.5分钟;最终采用CPU多核并行处理仅需0.4分钟,比初始版本提速17.5倍。实验表明,针对大规模图像处理任务,合理运用向量化运算和多核并行策略能显著提升执行效率。

2025-08-20 19:16:33 455

原创 Stable-DINO训练自建数据集

本文主要介绍了Stable-DINO这一高性能目标检测模型,并且详细讲解了如何使用该模型训练自建的数据集,给出了相应的yolo数据集转换为dino数据集的转换代码,最后给出了训练代码的完整修改细节。

2025-08-20 15:51:01 1254 2

原创 使用segment-anything将目标检测label转换为语义分割label

本文主要介绍了segment-anything这一自动分割图片的工具,并且给出了使用该工具将目标检测label转换为语义分割label的代码,最后对代码进行详细讲解。

2025-08-19 17:04:29 1465

原创 RF-DETR训练自建数据集代码及训练过程Debug

本文主要记录了使用rf-detr这一新型目标检测模型架构进行训练自己搭建的数据集的过程,并给出了相应的实现代码以及训练过程中可能遇到的报错情况和解决方法,此外还给出了将YOLO数据集转换为COCO数据集格式的代码,以及给出了rf-detr的预训练模型的下载地址。

2025-06-13 16:38:35 5555 4

原创 2025第16届蓝桥杯省赛之研究生组D题最大数字求解

本文主要对2025第16届蓝桥杯省赛之研究生组D题最大数字求解进行题目分析,和解题步骤解析,并给出了完整的实现代码,在洛谷平台上进行了代码提交,能够拿到满分。

2025-04-27 19:42:31 1219

原创 2012NOIP提高组之国王游戏求解与贪心算法

本文对国王游戏题目进行了解题思路详细分析与贪心算法的常用证明方法,并给出了题解的完整c++代码,同时在蓝桥杯和洛谷解题平台提交了代码,验证了代码正确性。

2025-04-23 20:37:04 853

原创 2025第16届蓝桥杯省赛之研究生组F题01串求解

本文主要对2025年第16届蓝桥杯省赛的研究生组F题01串,进行了题目分析与求解,并给出了详细的解题思路与步骤,及实现代码。

2025-04-15 15:13:42 1039 1

原创 C++蓝桥杯皮亚诺曲线距离求解

本文主要讲解了蓝桥杯皮亚诺曲线距离问题的求解思路,解题步骤以及实现代码,并且做了细致的解题思维分析以及Debug过程,最终在蓝桥杯测试平台对代码进行了测试,代码能够取得满分。

2025-03-10 15:41:04 1222

原创 C++使用BFS求解最短路径

本文主要介绍了BFS广度优先搜索的算法原理,以及蓝桥杯中使用BFS算法的两道题目:穿越雷区与迷宫与陷阱,对题目进行了分析并给出了解题代码,该代码在蓝桥杯的解题平台上进行了提交验证,可获得满分。

2025-03-09 19:03:58 1017

原创 C++、C#、python调用OpenCV进行图像处理耗时对比

本文主要介绍了C++、C#、python三种不同语言调用OpenCV进行图像处理操作时的耗时情况,进行了实际对比,并简单总结了对比结果,最后还给出了OpenCV的imread函数以不同模式读取图片的细微差别之处,还给出了imread读取彩色图转换为灰度图的原理公式。

2025-03-05 17:28:45 1843 2

原创 欧拉筛法寻找素数与计算欧拉函数求和

本文主要对欧拉筛法寻找素数的算法进行了讲解说明,并与Eratosthenes筛算法进行了实际运行时间测试,也对欧拉筛法计算欧拉函数求和算法进行了讲解,进行了一些改进,并且都给出了相应的实现代码。

2025-02-24 21:30:44 1272

原创 .NET软件开发框架简记

.NET开发框架概览 .NET是微软开发的软件开发平台,支持C#、F#和VB语言,核心框架包括.NET Framework(Windows专用)和.NET Core(跨平台)。桌面开发:WinForms(简单)、WPF(功能强大)仅支持Windows;MAUI(跨平台,支持Windows/macOS/iOS/Android)和Avalonia(支持Windows/Linux/macOS)可实现跨平台开发。 各框架在平台支持、开发体验和性能上各有特点,开发者可根据项目需求选择合适的框架。

2025-02-17 19:02:04 2195

原创 通过BingAPI爬取Bing半个月内壁纸

本文主要说明了通过BingAPI爬取Bing壁纸到本地的方法,给出了实现代码,并对代码进行了详细说明,最后给出了如何将下载的壁纸设置为系统壁纸的代码。

2025-02-17 18:57:10 794

原创 C#多线程异步连接MySQL与SQLserver数据库

本文主要说明了C#多线程异步连接MySQL与SQLserver数据库的用途和使用场景,并且给出了详细的实现代码。

2025-02-15 21:39:18 872

原创 WPF创建自定义类和控件及打包成dll引用

本文主要说明了WPF创建自定义类和控件及打包成dll引用的步骤,并给出了相关实现代码。

2025-02-15 21:36:52 2149

C#操作MySQL:数据库导入导出与C#连接实例

本资源详细介绍了如何使用C#连接MySQL数据库,以及数据库导入导出的操作,给出了相关实现代码。

2025-12-24

MySQL安装与使用详细教程

本资源详细介绍了数据库管理软件MySQL的安装与使用,着重介绍了5.6及之后版本的MySQL配置方法。

2025-12-23

pandas操作Excel文件之python代码实战

本资源介绍了如何使用pandas操作excel,以及给出了详细的python实现代码。

2025-12-23

30秒处理1万张图片-图像数据增强的高效执行代码

本资源介绍了如何高效地进行图像处理操作,对图像数据进行扩充,并给出了实现的python代码。

2025-12-22

YOLO格式MSCOCO2017目标检测数据集-图像长宽256-第1部分

本资源为数据集压缩包的第1部分,因为限制上传资源必须小于1000MB,所以共切分为6个压缩包上传。 下载后请将本资源后缀由.z00改为.zip,然后将下载的其余5个资源压缩包放在同一路径下进行解压。 本资源为目标检测领域中经典的MSCOCO2017目标检测数据集的转换格式,转换为YOLO格式,YOLO系列模型可直接使用本数据集,无需转换。 数据集共包含123287张图片(train118287+val5000)和122218(train117266+val4952)个txt标签文件,标签文件少于图片文件是因为原始标签文件中少部分图片没有标注。图像大小为256×256。 目标共有80类。

2025-12-22

Powershell操作Excel实战示例

本资源位使用powershell进行办公自动化的脚本代码,说明了如何自动化操作excel,提高工作效率。

2025-12-21

快速傅里叶变换简介及python实现

本资源对信号处理领域中广泛使用的快速傅里叶变换进行了介绍,结合完整的python代码实现详细介绍了FFT的实现计算过程,并给出了完整的python代码。

2025-12-21

YOLO格式MSCOCO2017目标检测数据集-图像长宽256-第6部分

本资源为数据集压缩包的第6部分,因为限制上传资源必须小于1000MB。 本资源为目标检测领域中经典的MSCOCO2017目标检测数据集的转换格式,转换为YOLO格式,YOLO系列模型可直接使用本数据集,无需转换。 数据集共包含123287张图片(train118287+val5000)和122218(train117266+val4952)个txt标签文件,标签文件少于图片文件是因为原始标签文件中少部分图片没有标注。图像大小为256×256。 目标共有80类,类别分别为 70: toaster 71: sink 72: refrigerator 73: book 74: clock 75: vase 76: scissors 77: teddy bear 78: hair drier 79: toothbrush等等。

2025-12-19

YOLO格式MSCOCO2017目标检测数据集-图像长宽256-第5部分

本资源为数据集压缩包的第5部分,因为限制上传资源必须小于1000MB。 本资源为目标检测领域中经典的MSCOCO2017目标检测数据集的转换格式,转换为YOLO格式,YOLO系列模型可直接使用本数据集,无需转换。 数据集共包含123287张图片(train118287+val5000)和122218(train117266+val4952)个txt标签文件,标签文件少于图片文件是因为原始标签文件中少部分图片没有标注。图像大小为256×256。 目标共有80类,类别分别为 60: dining table 61: toilet 62: tv 63: laptop 64: mouse 65: remote 66: keyboard 67: cell phone 68: microwave 69: oven等等。

2025-12-18

YOLO格式MSCOCO2017目标检测数据集-图像长宽256-第4部分

本资源为数据集压缩包的第4部分,因为限制上传资源必须小于1000MB。 本资源为目标检测领域中经典的MSCOCO2017目标检测数据集的转换格式,转换为YOLO格式,YOLO系列模型可直接使用本数据集,无需转换。 数据集共包含123287张图片(train118287+val5000)和122218(train117266+val4952)个txt标签文件,标签文件少于图片文件是因为原始标签文件中少部分图片没有标注。图像大小为256×256。 目标共有80类,类别分别为 40: wine glass 41: cup 42: fork 43: knife 44: spoon 45: bowl 46: banana 47: apple 48: sandwich 49: orange 50: broccoli 51: carrot 52: hot dog 53: pizza 54: donut 55: cake 56: chair 57: couch 58: potted plant 59: bed等等。

2025-12-18

YOLO格式MSCOCO2017目标检测数据集-图像长宽256-第3部分

本资源为数据集压缩包的第3部分,因为限制上传资源必须小于1000MB。 本资源为目标检测领域中经典的MSCOCO2017目标检测数据集的转换格式,转换为YOLO格式,YOLO系列模型可直接使用本数据集,无需转换。 数据集共包含123287张图片(train118287+val5000)和122218(train117266+val4952)个txt标签文件,标签文件少于图片文件是因为原始标签文件中少部分图片没有标注。图像大小为256×256。 目标共有80类,类别分别为 20: elephant 21: bear 22: zebra 23: giraffe 24: backpack 25: umbrella 26: handbag 27: tie 28: suitcase 29: frisbee 30: skis 31: snowboard 32: sports ball 33: kite 34: baseball bat 35: baseball glove 36: skateboard 37: surfboard 38: tennis racket 39: bottle等等。

2025-12-18

YOLO格式MSCOCO2017目标检测数据集-图像长宽256-第2部分

本资源为数据集压缩包的第2部分,因为限制上传资源必须小于1000MB。 本资源为目标检测领域中经典的MSCOCO2017目标检测数据集的转换格式,转换为YOLO格式,YOLO系列模型可直接使用本数据集,无需转换。 数据集共包含123287张图片(train118287+val5000)和122218(train117266+val4952)个txt标签文件,标签文件少于图片文件是因为原始标签文件中少部分图片没有标注。图像大小为256×256。 目标共有80类,类别分别为 0: person 1: bicycle 2: car 3: motorcycle 4: airplane 5: bus 6: train 7: truck 8: boat 9: traffic light 10: fire hydrant 11: stop sign 12: parking meter 13: bench 14: bird 15: cat 16: dog 17: horse 18: sheep 19: cow等等。

2025-12-18

YOLO格式VOC2012目标检测数据集-图像长宽512

本资源为目标检测领域中经典的VOC2012目标检测数据集的转换格式,转换为YOLO格式,YOLO系列模型可直接使用本数据集,无需转换。 数据集共包含11540张图片和txt标签文件,train5717+val5823=11540,图像大小为512×512。 目标共有20类,类别id可见压缩包内classid.txt文件。 数据集结构如下: images文件夹; labels文件夹; train.txt val.txt trainval.txt classid.txt

2025-12-13

YOLO格式VOC2012目标检测数据集-图像长宽256

本资源为目标检测领域中经典的VOC2012目标检测数据集的转换格式,转换为YOLO格式,YOLO系列模型可直接使用本数据集,无需转换。 数据集共包含11540张图片和txt标签文件,train5717+val5823=11540,图像大小为256×256。 目标共有20类,类别id可见压缩包内classid.txt文件。 数据集结构如下: images文件夹; labels文件夹; train.txt val.txt trainval.txt classid.txt

2025-12-13

YOLO格式VOC2007数据集-图像长宽512

本资源为目标检测领域中经典的VOC数据集的转换格式,转换为YOLO格式,YOLO系列模型可直接使用本数据集,无需转换。 数据集共包含9963张图片和txt标签文件,train2501+val2510+test4952=9963,图像大小为512×512。 目标共有20类,类别id可见压缩包内classid.txt文件。 数据集结构如下: images文件夹; labels文件夹; train.txt val.txt trainval.txt test.txt classid.txt

2025-12-12

【计算机视觉】基于区域注意力机制的实时目标检测模型:YOLOv12模型安装及原理和代码解析-下篇

内容概要:本文深入解析了YOLOv12模型的核心原理与代码实现,重点介绍了其以注意力机制为中心的创新架构。针对传统注意力机制计算复杂度高的问题,YOLOv12提出区域注意力(Area Attention)机制,通过将特征图划分为多个区域,在保持全局依赖建模能力的同时显著降低计算开销,提升实时性。同时引入残差高效层聚合模块(R-ELAN,即A2C2f),通过残差连接与缩放因子解决梯度阻塞问题,增强特征融合稳定性。模型结构上,YOLOv12在YOLOv11基础上替换主干网络中的C3k2模块为A2C2f,并去除SPPF和C2PSA等组件,优化整体架构。此外,对注意力机制内部结构进行改进,如调整MLP比例、使用卷积替代全连接、采用可分离卷积替代位置编码等,进一步提升效率与性能。 适合人群:具备深度学习与计算机视觉基础,熟悉PyTorch框架,从事目标检测相关研发工作的工程师或研究人员,尤其是关注YOLO系列模型演进的技术人员。 使用场景及目标:①理解YOLOv12如何将注意力机制高效集成到实时检测模型中;②掌握区域注意力与R-ELAN模块的设计思想与代码实现;③为自研高效注意力模型或改进现有YOLO架构提供技术参考。 阅读建议:建议结合YOLOv11与YOLOv12的结构对比进行学习,重点关注AAttn与A2C2f类的实现细节,并在实际环境中运行代码以加深对模块功能与数据流的理解。

2025-12-11

【计算机视觉】基于区域注意力机制的实时目标检测模型:YOLOv12模型安装及原理和代码解析-上篇

内容概要:本文详细介绍了YOLOv12目标检测模型的背景、发展历程及其安装与使用方法。文章首先回顾了目标检测领域的两大主流技术路线——以R-CNN为代表的两阶段检测和以YOLO为代表的一阶段检测,并梳理了从YOLOv1到YOLOv13的技术演进历程。重点介绍YOLOv12的核心创新点:采用区域注意力机制替代传统CNN,提升特征表达能力,并支持目标检测、实例分割和图像分类任务。随后,文章提供了YOLOv12在Linux环境下的完整安装流程,包括Python环境配置、依赖库安装(如PyTorch和flash_attn)、源码克隆、依赖安装及测试验证步骤。同时附带了训练与推理代码示例、配置文件说明以及常见资源(如预训练权重、数据集、字体文件)的下载方式。 适合人群:具备深度学习基础、熟悉目标检测任务,有一定Python开发经验的算法工程师或研究人员,尤其是从事工业检测、自动驾驶、视频监控等相关领域工作的技术人员。 使用场景及目标:①快速部署YOLOv12模型用于实际项目中的目标检测任务;②深入理解YOLO系列模型的架构演变与注意力机制的应用;③基于YOLOv12进行二次开发、性能优化或学术研究。 阅读建议:建议读者在具备CUDA、PyTorch等深度学习环境搭建经验的基础上,结合GitHub项目源码边操作边学习,重点关注yolov12.yaml配置结构、A2C2f模块设计及multi-scale head的实现细节,并根据硬件条件调整batch size和设备参数以确保顺利运行。

2025-12-11

YOLO格式VOC2007数据集-图像长宽256

本资源为目标检测领域中经典的VOC数据集的转换格式,转换为YOLO格式,YOLO系列模型可直接使用本数据集,无需转换。 数据集共包含9963张图片和txt标签文件,train2501+val2510+test4952=9963,图像大小为256×256。 目标共有20类,类别id可见压缩包内classid.txt文件。 数据集结构如下: images文件夹; labels文件夹; train.txt val.txt trainval.txt test.txt classid.txt

2025-12-11

【计算机视觉】基于PyTorch的YOLOv11目标检测模型结构解析与源码复现-下篇

内容概要:本文详细解析了YOLOv11的目标检测模型结构及其源码实现,涵盖Backbone、Neck和Head三大核心组件。文章介绍了CBS、C3k2、SPPF和C2PSA等关键模块的设计与代码实现,阐述了特征提取、多尺度融合以及分类与边界框预测的完整流程。特别地,文中深入讲解了基于注意力机制的PSA模块和DFL(Distribution Focal Loss)在提升检测精度方面的作用,并提供了完整的模型构建代码,展示了不同规模(n/s/m/l/x)模型的配置差异。 适合人群:具备深度学习基础,熟悉PyTorch框架,有一定计算机视觉经验的研发人员或学生;适合从事目标检测相关工作的开发者。 使用场景及目标:①理解YOLOv11的网络架构设计思想与模块组合逻辑;②掌握现代YOLO系列模型中特征融合、注意力机制与边界框回归技术的具体实现方式;③通过源码复现提升对工业级目标检测模型的开发与调试能力。 阅读建议:建议结合代码逐模块运行并可视化中间输出,加深对各层功能的理解;同时可对比YOLO其他版本差异,深入体会模型演进思路。

2025-12-08

【计算机视觉】基于PyTorch的YOLOv11目标检测模型结构解析与源码复现-上篇

内容概要:本文详细解析了YOLOv11的目标检测模型结构及其源码复现方法,涵盖YOLO的发展历程、目标检测的两大技术流派(one-stage与two-stage),并重点介绍了YOLOv11的网络组成模块,如CBS、C3k2、SPPF和C2PSA等,阐述了其在特征提取、多尺度融合、分类与边界框预测方面的设计原理。文章还提供了两种使用YOLOv11的方式:一是通过官方ultralytics软件包快速部署与训练;二是采用简化版的PyTorch实现(YOLOv11-pt)进行模型结构分析与定制化修改,便于深入理解内部机制。 适合人群:具备一定深度学习基础,熟悉PyTorch框架,从事计算机视觉相关工作的研究人员或工程师,尤其是关注目标检测模型开发与优化的从业者; 使用场景及目标:①帮助读者掌握YOLOv11的核心架构与模块设计思想;②指导如何使用官方API快速训练和推理;③通过替代源码实现模型结构的清晰理解和二次开发;④为后续研究YOLO系列模型提供实践基础; 阅读建议:建议读者结合官方GitHub项目与文中推荐的简化源码对照学习,动手实践模型训练与推理流程,重点关注各模块的PyTorch实现细节,以加深对YOLOv11整体架构的理解。

2025-12-08

【计算机视觉】基于Python的SIFT算法实现:尺度不变特征提取与图像匹配系统设计

内容概要:本文详细解析了SIFT(尺度不变特征变换)算法的原理与Python代码实现,涵盖算法的核心步骤:构造尺度空间、检测关键点、计算关键点方向、生成关键点描述子,并提供了完整的代码分析与实现流程。文章基于GitHub上一个高星开源项目,通过逐段代码讲解帮助读者深入理解SIFT算法的每一环节,包括高斯金字塔构建、DOG极值检测、关键点精确定位、方向分配及128维描述子生成。同时展示了算法在图像匹配中的应用实例,并与OpenCV内置SIFT函数进行性能对比,验证了自实现代码的正确性但指出其效率较低。 适合人群:具备一定Python编程基础和图像处理基础知识,对计算机视觉感兴趣的初学者或中级研发人员,尤其是希望深入理解SIFT算法内部机制的学习者。 使用场景及目标:①学习SIFT算法从理论到代码的完整实现过程;②掌握特征提取、关键点匹配、图像配准等计算机视觉任务的技术细节;③对比自实现与OpenCV优化版本的性能差异,理解工业级算法优化的重要性。

2025-12-04

入门手写数字识别CNN实战pytorch代码(GPU版)

本资源为手写数字识别分类的入门级实战代码,代码使用pytorch架构编写,需要通过GPU进行训练。 代码编写了一个简单的卷积神经网络,输入为单通道的28×28图片,输出是一个10维向量。 数据集的格式应在代码文件同目录下包含两个文件夹,分别为训练文件夹和测试文件夹,训练和测试文件夹下各包含10个以0~9数字命名的文件夹,文件夹中包含了对应的若干张图片文件。 代码在每轮训练结束后会输出训练集分类正确率和测试集分类正确率,并且记录在txt文件中。

2025-12-04

入门手写数字识别CNN实战pytorch代码(CPU版)

本资源为手写数字识别分类的入门级实战代码,代码使用pytorch架构编写,并且无需显卡,只通过CPU进行训练。 代码编写了一个简单的卷积神经网络,输入为单通道的28×28图片,输出是一个10维向量。 数据集的格式应在代码文件同目录下包含两个文件夹,分别为训练文件夹和测试文件夹,训练和测试文件夹下各包含10个以0~9数字命名的文件夹,文件夹中包含了对应的若干张图片文件。 代码在每轮训练结束后会输出训练集分类正确率和测试集分类正确率,并且记录在txt文件中。

2025-12-04

mnist图片格式数据集

本资源为mnist数据集的图片格式,原始数据集为.ubyte 文件是特殊的二进制格式,不利于数据可视化,因此将原始格式进行了转换,并且从利于实际使用的角度进行了文件编排。 压缩包内含两个文件夹为mnist_tran、mnist_test,文件夹内各包含10个文件夹,以数字命名,10个文件夹内就是对应数字的多张png格式的图片。 mnist_tran包含6万张图片,mnist_test包含1万张图片。

2025-12-03

【机器学习优化】基于模拟退火与遗传算法融合的FCM聚类优化:二维数据点簇划分性能提升方法研究

内容概要:本文介绍了模拟退火算法的基本原理及其在聚类问题中的应用,重点结合遗传算法优化模糊C-均值(FCM)聚类算法的初始中心点选择问题。文章首先概述智能优化算法背景,解释模拟退火算法如何通过模拟物理退火过程跳出局部最优,并引入遗传算法增强全局搜索能力,形成SAGA混合优化策略。随后详细描述聚类任务设定,使用Python实现FCM算法与SAGA优化算法,并通过实验对比二者性能。结果显示,SAGA优化后的FCM目标函数值更低(3.4585 vs 3.4635),表明其具有更强的全局寻优能力。代码部分涵盖数据生成、目标函数计算、种群演化、退火机制及可视化等模块。 适合人群:具备Python编程基础、了解基本机器学习与优化算法的高校学生、科研人员及算法工程师,尤其适合对智能优化算法感兴趣的技术人员; 使用场景及目标:①学习模拟退火与遗传算法的基本思想及其融合机制;②掌握FCM聚类算法的局限性及优化方法;③通过实际代码理解元启发式算法在聚类中的应用,提升解决复杂优化问题的能力。

2025-11-20

路径规划基于蚁群算法的二维最优路径求解:Python代码实现与MAKLINK图论模型应用

内容概要:本文介绍了基于蚁群算法求解二维空间中带障碍物环境下的最佳路径问题,结合MAKLINK图论构建可行路径网络,并利用Dijkstra算法生成初始路径,再通过蚁群优化算法在简化后的解空间中搜索更优路径。文章详细阐述了蚁群算法的原理及其在路径规划中的应用,提供了完整的Python实现代码,涵盖距离矩阵计算、路径可视化、信息素更新机制等核心模块,并展示了算法迭代优化前后的路径对比效果,验证了蚁群算法在路径优化中的有效性。 适合人群:具备Python编程基础并对智能优化算法有一定了解的学生或研究人员,适用于从事路径规划、机器人导航、运筹优化等相关领域的初学者和实践者; 使用场景及目标:①学习蚁群算法的基本原理及其实现方式;②掌握将图论方法(MAKLINK)与智能算法结合解决实际路径规划问题的方法;③通过代码实践理解Dijkstra与蚁群算法的协同优化流程。

2025-11-15

【运筹学与智能优化】基于遗传算法的TSP问题求解:Python代码实现与路径优化应用

内容概要:本文详细介绍了利用遗传算法求解TSP(旅行商问题)的Python代码实战。首先概述了遗传算法作为智能优化算法的基本原理,包括种群初始化、适应度函数设计、选择、交叉与变异等操作,并将其应用于TSP这一经典的NP难组合优化问题。文章以14个城市为例,给出了完整的Python实现代码,涵盖城市坐标设定、距离矩阵构建、适应度计算、交叉变异策略(包括部分映射交叉和逆序变异)以及迭代优化流程,并通过日志记录和结果输出展示最优路径和最短距离。 适合人群:具备Python编程基础并对优化算法感兴趣的高校学生、算法工程师或科研人员,尤其是希望深入理解遗传算法实际应用的学习者; 使用场景及目标:①学习遗传算法的核心机制及其在组合优化问题中的实现方式;②掌握TSP问题的建模与近似求解方法;③通过代码实践理解种群演化、精英保留策略、交叉与变异操作的具体编码实现。

2025-11-13

【运筹学与智能优化】基于禁忌搜索算法的31城市TSP路径规划:Python实现与局部最优解求解

内容概要:本文介绍了旅行商问题(TSP)及其求解方法,重点讲解了禁忌搜索算法的基本原理与实现过程。文章首先概述TSP问题的定义与复杂性,指出其属于NP难问题,随后对比了动态规划与智能优化算法的优劣。接着详细阐述禁忌搜索算法的核心思想——通过引入禁忌表避免重复搜索,跳出局部最优,从而提升全局寻优能力。最后,提供了完整的Python代码实现,用于求解31个城市的TSP问题,包括距离矩阵计算、邻域生成、禁忌表管理等关键步骤,并展示了算法运行结果,最短路径距离约为15380.5153。 适合人群:具备一定Python编程基础,对优化算法感兴趣的高校学生、算法工程师或运筹学初学者;有志于学习智能优化算法在组合优化中应用的人员。 使用场景及目标:①理解禁忌搜索算法在TSP问题中的具体实现机制;②掌握禁忌表的设计与邻域搜索策略;③通过代码实践提升对智能优化算法的动手能力和调参经验;④作为进一步研究遗传算法、蚁群算法等其他启发式算法的基础。

2025-10-06

【智能优化算法】基于粒子群优化的函数最值求解:Python实现连续空间全局最优解

内容概要:本文介绍了粒子群算法(PSO)的基本原理及其在求解函数最值问题中的Python实现。文章首先概述了智能优化算法的概念,并重点讲解粒子群算法的起源与核心思想,即通过模拟群体行为在搜索空间中寻找最优解。随后,给出了一个具体的函数优化实例,利用Python代码实现了PSO算法对二维函数在(-2,2)区间内的最大值求解过程,包括粒子位置与速度的初始化、适应度计算、个体与全局最优更新等关键步骤,并提供了完整的代码结构与参数设置。最终实验结果显示算法能有效逼近理论最优解。 适合人群:具备基本Python编程能力和优化算法基础知识的高校学生、科研人员或工程技术人员;适合对智能计算、群体智能算法感兴趣的学习者。 使用场景及目标:①理解粒子群算法的工作机制与实现流程;②掌握如何用Python实现经典智能优化算法;③应用于连续空间函数优化、参数调参等实际问题中。

2025-10-06

火焰与烟雾图像识别超大数据集-part2

本资源为火焰与烟雾针对目标识别任务的图像数据集,标签格式为YOLO标签格式,汇集了目前网上能够找到的公开的数据集,总图片数量约20万张(只包含少量人工合成的烟雾图片,其余都为真实图片),是目前网上能够搜索到的最大的火焰和烟雾数据集之一。 数据集由不包含火焰和烟雾的负样本图片,数量51795张,和包含火焰或烟雾的正样本图片,数量149531张(都已标注)组成,共计201326张图片,图像大小为512×512。 整个数据集大小约为6G,因上传资源限制大小,所以切分为7个压缩包,其中分卷1为收费资源,分卷2~7为免费资源,全部下载才能够完整解压。 读者购买分卷1后遇到下载等问题可联系作者。

2026-01-11

火焰与烟雾图像识别超大数据集-part3

本资源为火焰与烟雾针对目标识别任务的图像数据集,标签格式为YOLO标签格式,汇集了目前网上能够找到的公开的数据集,总图片数量约20万张(只包含少量人工合成的烟雾图片,其余都为真实图片),是目前网上能够搜索到的最大的火焰和烟雾数据集之一。 数据集由不包含火焰和烟雾的负样本图片,数量51795张,和包含火焰或烟雾的正样本图片,数量149531张(都已标注)组成,共计201326张图片,图像大小为512×512。 整个数据集大小约为6G,因上传资源限制大小,所以切分为7个压缩包,其中分卷1为收费资源,分卷2~7为免费资源,全部下载才能够完整解压。 读者购买分卷1后遇到下载等问题可联系作者。 标签索引说明: 0:fire 1:smoke

2026-01-11

火焰与烟雾图像识别超大数据集-part4

本资源为火焰与烟雾针对目标识别任务的图像数据集,标签格式为YOLO标签格式,汇集了目前网上能够找到的公开的数据集,总图片数量约20万张(只包含少量人工合成的烟雾图片,其余都为真实图片),是目前网上能够搜索到的最大的火焰和烟雾数据集之一。 数据集由不包含火焰和烟雾的负样本图片,数量51795张,和包含火焰或烟雾的正样本图片,数量149531张(都已标注)组成,共计201326张图片,图像大小为512×512。 整个数据集大小约为6G,因上传资源限制大小,所以切分为7个压缩包,其中分卷1为收费资源,分卷2~7为免费资源,全部下载才能够完整解压。 读者购买分卷1后遇到下载等问题可联系作者。 imageF开头的为不包含火焰和烟雾的负样本图片,数量51795 imageT开头的为包含火焰或烟雾的正样本图片,数量149531

2026-01-11

火焰与烟雾图像识别超大数据集-part5

本资源为火焰与烟雾针对目标识别任务的图像数据集,标签格式为YOLO标签格式,汇集了目前网上能够找到的公开的数据集,总图片数量约20万张(只包含少量人工合成的烟雾图片,其余都为真实图片),是目前网上能够搜索到的最大的火焰和烟雾数据集之一。 数据集由不包含火焰和烟雾的负样本图片,数量51795张,和包含火焰或烟雾的正样本图片,数量149531张(都已标注)组成,共计201326张图片,图像大小为512×512。 整个数据集大小约为6G,因上传资源限制大小,所以切分为7个压缩包,其中分卷1为收费资源,分卷2~7为免费资源,全部下载才能够完整解压。 读者购买分卷1后遇到下载等问题可联系作者。 train.txt文件中包含191259张训练图片,占总数量的95%,约等于149531*0.95+51795*0.95 val.txt文件中包含10067张训练图片,占总数量的5%,约等于149531*0.05+51795*0.05

2026-01-11

火焰与烟雾图像识别超大数据集-part6

本资源为火焰与烟雾针对目标识别任务的图像数据集,标签格式为YOLO标签格式,汇集了目前网上能够找到的公开的数据集,总图片数量约20万张(只包含少量人工合成的烟雾图片,其余都为真实图片),是目前网上能够搜索到的最大的火焰和烟雾数据集之一。 数据集由不包含火焰和烟雾的负样本图片,数量51795张,和包含火焰或烟雾的正样本图片,数量149531张(都已标注)组成,共计201326张图片,图像大小为512×512。 整个数据集大小约为6G,因上传资源限制大小,所以切分为7个压缩包,其中分卷1为收费资源,分卷2~7为免费资源,全部下载才能够完整解压。 读者购买分卷1后遇到下载等问题可联系作者。 数据集文件夹结构如下: images文件夹 labels文件夹 train.txt val.txt 数据集说明.txt

2026-01-11

火焰与烟雾图像识别超大数据集-part7

本资源为火焰与烟雾针对目标识别任务的图像数据集,标签格式为YOLO标签格式,汇集了目前网上能够找到的公开的数据集,总图片数量约20万张(只包含少量人工合成的烟雾图片,其余都为真实图片),是目前网上能够搜索到的最大的火焰和烟雾数据集之一。 数据集由不包含火焰和烟雾的负样本图片,数量51795张,和包含火焰或烟雾的正样本图片,数量149531张(都已标注)组成,共计201326张图片,图像大小为512×512。 整个数据集大小约为6G,因上传资源限制大小,所以切分为7个压缩包,其中分卷1为收费资源,分卷2~7为免费资源,全部下载才能够完整解压。 读者购买分卷1后遇到下载等问题可联系作者。 数据集文件夹结构如下: images文件夹 labels文件夹 train.txt val.txt 数据集说明.txt train.txt文件中包含191259张训练图片,占总数量的95%,约等于149531*0.95+51795*0.95 val.txt文件中包含10067张训练图片,占总数量的5%,约等于149531*0.05+51795*0.05

2026-01-11

火焰与烟雾图像识别超大数据集-part1

本资源为火焰与烟雾针对目标识别任务的图像数据集,标签格式为YOLO标签格式,汇集了目前网上能够找到的公开的数据集,总图片数量约20万张(只包含少量人工合成的烟雾图片,其余都为真实图片),是目前网上能够搜索到的最大的火焰和烟雾数据集之一。 数据集由不包含火焰和烟雾的负样本图片,数量51795张,和包含火焰或烟雾的正样本图片,数量149531张(都已标注)组成,共计201326张图片,图像大小为512×512。 整个数据集大小约为6G,因上传资源限制大小,所以切分为7个压缩包,其中分卷1为收费资源,分卷2~7为免费资源,全部下载才能够完整解压。 读者购买分卷1后遇到下载等问题可联系作者。 数据集文件夹结构如下: images文件夹 labels文件夹 train.txt val.txt 数据集说明.txt 标签索引说明: 0:fire 1:smoke imageF开头的为不包含火焰和烟雾的负样本图片,数量51795 imageT开头的为包含火焰或烟雾的正样本图片,数量149531 共计201326张图片 train.txt文件中包含191259张训练图片,占总数量的95%,约等于149531*0.95+51795*0.95 val.txt文件中包含10067张训练图片,占总数量的5%,约等于149531*0.05+51795*0.05

2026-01-11

YOLOv11与v12与v13检测精度对比报告及实战训练代码

本资源详细描述了如何使用YOLOv11、v12与v13这三个目前最新版的YOLO模型进行训练,给出相应的实现代码。 此外,还在VOC2007数据集上对三种模型的精度进行了对比分析,包括使用AdamW、SGD不同优化器训练,使用或不使用flashattn包对v12训练结果的影响,以及相同参数下v11、v12、v13的精度比较。所有对应的参数、训练模型及评估文件都放入了压缩包中。 最后将上述内容写成了一份PDF形式的报告,可以为计算机视觉研究人员提供模型选择参考,也可以作为大学生课设作品。

2026-01-08

python进行矩阵运算

本资源详细介绍了在python中进行的几种常规的矩阵运算,给出了两种实现方法,并且对两种方法的实现效果进行了对比,最终都给出了完整的实现python代码。

2025-12-25

RF-DETR训练自建数据集代码及训练过程Debug

本资源详细介绍了如何使用目标识别模型RF-DETR训练自建数据集,并且记录了训练过程中可能遇到的问题及解决方法,并给出了完整的实现代码。

2025-12-25

AIGC之StableDiffusion安装与运行详细介绍

本资源详细介绍了图像生成StableDiffusion工具包的安装,以及使用方法及实现的python代码,能够生成图片以及修复图片。

2025-12-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除