向上生长的程序媛的博客

90后程序媛，主要研究方向为：遥感卫星图像地物要素智能识别、遥感影像变化检测、工业场景目标检测和语义分割、实例分割等。

原创【红外】用SIRST数据集复现图像小目标分割HCFNet-附数据集和python代码

红外小目标检测是一项重要的计算机视觉任务，涉及对红外图像中微小物体的识别和定位，这些图像通常仅包含几个像素。然而，由于物体的体积很小，而且红外图像中的背景通常很复杂，因此遇到了困难。在本文中，我们提出了一种深度学习方法 HCF-Net，该方法通过多个实用模块显著提高了红外小目标检测性能。具体来说，它包括并行补丁感知注意力（PPA）模块、维度感知选择性集成（DASI）模块和多扩张通道精简器（MDCR）模块。PPA 模块使用多分支特征提取策略来捕获不同尺度和级别的特征信息。DASI 模块。

2025-05-13 14:25:58 928

原创【超分辨率】A Spectral Diffusion Prior for Hyperspectral ImageSuper-Resolution论文复现（含python代码）

论文提出了一种基于融合的高光谱图像（HSI）超分辨率方法，名为“Spectral Diffusion Prior（SDP）”，旨在通过融合低空间分辨率的HSI和高空间分辨率的多光谱图像（MSI）来生成高空间分辨率的HSI。

2025-05-06 16:08:52 698

原创【红外】复现PIAFuison网络，含Python代码和数据集

红外和可见光图像融合旨在合成单个融合图像，即使在极端照明条件下，也能包含突出的目标和丰富的纹理细节。然而，现有的图像融合算法未能在建模过程中考虑照明因子。在本文中，我们提出了一种基于照明感知的渐进式图像融合网络，称为 PIAFusion，它可以自适应地保持突出目标的强度分布，并在背景中保留纹理信息。具体来说，我们设计了一个照明感知子网络来估计照明分布并计算照明概率。此外，我们利用照明概率构建照明感知损失来指导融合网络的训练。跨模态差分感知融合模块和中途融合策略。

2025-04-22 15:41:40 716

原创【HuggingFace】查找、下载数据和模型（小白都能会）

HuggingFace 被视为 AI 模型界的 GitHub，通过开放的社区文化和丰富的资源，推动了机器学习技术的普及和创新。：拥有超过 150 万个开源 AI 模型，涵盖自然语言处理（如 BERT、GPT）、计算机视觉、音频处理和多模态任务。通过以上步骤，就可以轻松查询和下载 Hugging Face 上的模型和数据集了，并在本地使用。：支持多种预训练模型，如 BERT、GPT、T5 等，适用于文本分类、生成、问答等任务。，旨在帮助开发者和研究人员快速使用、训练和部署 AI 模型。

2025-04-11 16:26:06 880

原创【非机动车检测】用YOLOv8实现非机动车及驾驶人佩戴安全帽检测

0：安全帽1: 驾驶人未戴安全帽2：驾驶人戴安全帽3：非机动车部分影像展示如下：label为txt格式的yolo目标检测格式，示例txt文件内容为：训练验证比例可以自行调整，这里不赘述。

2025-04-10 09:49:52 1844

原创【工业场景】用YOLOv12实现饮料类别识别

饮料类别识别数据集为特定场景下的15种常见饮料，部分影像展示如下：label为txt格式的yolo目标检测格式，示例txt文件内容为：训练验证比例可以自行调整，这里不赘述。

2025-04-02 14:21:48 1199 5

原创【Geoseg】工程复现+训练自己的数据

近年来，深度学习算法，特别是基于全卷积网络（FCN）的方法，在遥感领域变得非常流行。然而，这些方法通常在不同的数据集和深度学习框架中实现和评估，缺乏。

2025-04-01 15:54:07 1839

原创【YOLOv12改进trick】DynamicTanh（DyT）模块引入YOLOv12，实现涨点和效率提升，含创新点Python代码

🍋模块🍋模块通过通过模仿（如tanh函数的S形曲线），在的情况下实现。🍋🍋：DynamicTanh即插即用适用于注意力块、FFN块和最终归一化层，尽管它可能看起来像是激活函数，但在这篇研究中不会改变原始架构中激活函数的任何部分，网络的其他部分也保持不变。🍋🍋：医学影像分割、语义分割、目标检测、图像分类🍋思路来源何恺明LeCun联手打造，论文已入选。

2025-04-01 09:36:47 253

原创【TransAttUnet】 Multi-level Attention-guided U-Netwith Transformer for Medical Image Segmentation

本文介绍了一种名为的新型网络，该网络，并融合了和，旨在提高医学图像分割的准确性。文章详细阐述了TransAttUnet的设计原理、结构组成以及在多个医学图像分割数据集上的实验验证，并与其他先进方法进行了比较。

2025-03-21 10:08:56 802

原创【色调转换】应用于图像风格转换、匀光匀色等场景

首先看效果，支持SAR影像色调统一、光学遥感影像色调统一、自然影像色调统一。：色调参考图：待处理的图：色调转换后的处理结果图色调转换的算法将其封装成可执行程序exe文件，直接双击打开即可在软件界面上实现该功能。

2025-03-21 09:29:19 848

原创【YOLOv12改进trick】自注意力模块ScaledDotProductAttention（TSA）引入YOLOv12，实现涨点和效率提升，含创新点Python代码

🍋自注意力模块🍋🍋：ScaledDotProductAttention模块通过和表示来提高医学图像分割的准确性和效率。🍋🍋：在ScaledDotProductAttention中，用Transformer中的多头自注意力机制，能够捕获输入特征之间的长距离依赖关系，帮助模型理解，从而提高分割的准确性。。🍋适用场景🍋：医学影像分割、语义分割、目标检测、图像分类🍋。

2025-03-20 09:18:33 91

原创【FPS】图像预测代码添加FPS计算

给任意一段预测代码添加FPS计算的万能公式。

2025-03-18 14:00:20 418

原创【语义分割YOLO格式label可视化】YOLO格式txt文件label可视化，含python代码

第一部分为类别信息，用数字表示，从0开始第二部分为多边形边界坐标点信息，取值范围为归一化后的[0,1]示例语义分割的YOLO格式txt文件如下，共有2个目标对象：用python代码实现语义分割YOLO格式txt文件的label可视化成如下效果。

2025-03-12 17:09:28 442

原创【从YOLO格式label中裁剪原图】根据txt格式检测结果或label文件从原图中裁剪出目标

依据目标检测结果框（YOLO格式txt）或label从原图中裁剪目标

2025-03-12 16:40:36 279

原创【YOLOv12改进trick】专栏精选合集

YOLO系列优化改进trick大合集

2025-03-11 10:19:34 2036 2

原创【YOLOv12改进trick】通道聚合FFN模块ChannelAggregationFFN引入YOLOv12，实现涨点和效率提升，含创新点Python代码

即插即用模块通道聚合FFN模块ChannelAggregationFFN引入YOLOv12，含Python代码修改

2025-03-10 15:10:16 338

原创【YOLOv12改进trick】多节门控聚合模块MultiOrderGatedAggregation模块引入YOLOv12，实现涨点和效率提升，含创新点Python代码

多节门控聚合模块MultiOrderGatedAggregation引入YOLOv12，即插即用模块实现快速涨点

2025-03-10 14:39:28 335

原创【YOLOv12改进trick】高效多尺度卷积注意力EMCAD_Block模块引入YOLOv12，实现涨点和效率提升，含创新点Python代码

EMCAD引入YOLOv12模块，实现高效多尺度注意力模块引入到YOLOv12中的快速涨点及效率提升

2025-03-10 14:05:00 487

原创【YOLOv12改进trick】轻量级下采样ContextGuidedBlock_Down模块替换Conv模块，创新涨点优化，含创新点Python代码

ContextGuidedBlock_Down模块替换yolov12的Conv模块，实现快速涨点

2025-03-07 17:01:31 288 2

原创【YOLOv12改进trick】优化loss函数（AdaptiveThresholdFocalLoss），含创新点Python代码，方便发论文

优化yolov12的损失函数

2025-03-07 16:11:37 640

原创【YOLOv12改进trick】遥感图像分割MSAA多尺度特征融合模块（即插即用）引入YOLOv12中实现涨点，含创新点Python代码，方便发论文

遥感多尺度特征融合模块MSAA引入YOLOv12，涨点明显，即插即用。含Python代码修改

2025-03-07 14:15:08 327

原创【YOLOv12改进trick】医学图像分割网络CMUNeXt与C3K2结合，构建C3k2_CMUNeXt模块引入YOLOv12中实现涨点，含创新点Python代码，方便发论文

改进模块🍋🍋：CMUNeXtBlock模块和C3K3模块组合生成C3k2_CMUNeX模块替换C3K2模块，实现yolov12涨点，含Python代码

2025-03-07 11:26:00 1184

原创【YOLOv12改进trick】医学图像分割网络CMUNeXt引入YOLOv12中，增强全局上下文信息实现涨点，含创新点Python代码，方便发论文

医学图像分割CMUNeXtBlock模块引入YOLOv12,提取全局上下文信息，同时保持卷积的归纳偏差，实现涨点优化。

2025-03-07 10:35:42 600

原创【YOLOv12改进trick】三重注意力TripletAttention引入YOLOv12中，实现遮挡目标检测涨点，含创新点Python代码，方便发论文

近乎parameter-free的即插即用attention模块三重注意力TripletAttention模块，涨点很明显

2025-03-06 17:07:06 1192

原创【YOLOv12改进trick】多尺度大核注意力机制MLKA模块引入YOLOv12，实现多尺度目标检测涨点，含创新点Python代码，方便发论文

超分辨率提升的MLKA多尺度大核注意力机制引入YOLOv12，实现小目标和模糊目标检测涨点优化，含python代码修改

2025-03-06 16:11:31 1153

原创【YOLOv12改进trick】超分辨率SAFM模块替换上采样模块，引入YOLOv12，实现模糊目标检测涨点，含创新点Python代码，方便发论文

SAFM模块替换原有YOLO的上采样模块，对小目标检测、模糊目标检测涨点明显，含Python代码

2025-03-06 14:46:58 1284

原创【YOLOv12改进trick】StarBlock引入YOLOv12，创新涨点优化，含创新点Python代码，方便发论文

starblock引入YOLOv12中，简单操作实现快速涨点，含修改代码处

2025-03-06 09:57:06 1080

原创【YOLOv12改进trick】DynamicConv替换YOLOv12中的Conv模块，创新涨点优化，含创新点Python代码，方便发论文

动态卷积DynamicConv解决现有的低FLOPs模型无法从大规模预训练中受益等问题，将其引入YOLOv12，实现涨点

2025-03-05 17:38:35 885

原创【YOLOv12改进trick】多核Inception网络PKINet，替换YOLO骨干网络，创新涨点优化，含创新点Python代码，方便发论文

多核Inception网络PKINet引入YOLOv12，含Python代码，优化涨点，发paper适用

2025-03-05 15:01:56 758

原创【YOLO12全网首发】训练+测试行人摔倒

YOLOv12训练自己的数据集，含Python代码。

2025-03-04 13:26:40 1931

原创【YOLO11改进trick】Attention引入，比CBAM还牛的GAM模块，含创新点GAM模块代码，方便发论文

注意力机制模块GAM引入YOLO11，显著提升检测精度，比其他注意力机制模块涨点明显，即插即用。推荐指数五颗星！适合发paper。

2025-02-27 09:57:55 1453

原创【YOLO11改进trick】Attention引入，含创新点CBAM模块代码，方便发论文

即插即用模块CBAM注意力机制引入YOLO11，实现轻松涨点，方便发paper

2025-02-26 16:27:42 1002

原创【目标检测旋转框xml2txt】rolabelimg标注的xml格式label转YOLO格式txt文件

rolabelimg软件标注的xml转yolo格式txt。

2025-02-26 09:25:19 526

原创【YOLO11改进trick】Attention引入，含创新点MSCAA模块代码，方便发论文

创新模块MSCAAttention模块引入YOLO系列，并附python代码

2025-02-21 13:46:36 987 1

原创【YOLO11改进trick】损失函数改进，含创新点SDIOU代码，方便发论文

DFL losselse:BboxLoss类是一个用于计算训练过程中边界框（bbox）损失的准则类。它主要包含两个部分的损失计算：IoU 损失和 DFL 损失。IoU 损失计算预测边界框和目标边界框之间的 IoU（交并比）。使用 CIoU（Complete Intersection over Union）方法计算 IoU，考虑了边界框的中心点距离和宽高比。

2025-02-20 16:24:17 2211 4

原创【YOLO11改进trick】Pinwheel-shaped Conv风车状卷积引入YOLO11，含创新点代码，方便发论文

将PConv风车状卷积引入到YOLO11中的创新点及python代码

2025-02-20 14:51:39 1981

原创【去雨去雾小工具】用python实现去雨去雾的小工具

窗口分为三个部分：左侧显示原始图像。右侧上方显示去雨后的图像。右侧下方显示去雾后的图像。按钮位于窗口底部，用于加载图像、去雨和去雾操作。

2025-02-14 11:27:41 795

原创【工业场景】用YOLOv8实现烟雾识别

烟雾检测数据集总共包含19208张样本数据，其中训练集18240张，验证集1968张，部分影像展示如下：label为txt格式的yolo目标检测格式，示例txt文件内容为：训练验证比例可以自行调整，这里不赘述。

2025-02-12 10:38:56 1111

原创【工业场景】用YOLOv8实现火灾识别

火灾检测数据集总共包含42877张样本数据，其中训练集38590张，验证集4287张，部分影像展示如下：label为txt格式的yolo目标检测格式，示例txt文件内容为：训练验证比例可以自行调整，这里不赘述。

2025-02-12 10:08:17 2064

原创【目标检测txt2json】label从YOLO格式txt文件转COCO格式json文件

COCO整个训练集的标注都在一个文件内，json文件可以理解为键值对的格式，所以这边看最外层可以发现，整个标注其实由下面5个部分组成，每个部分又是新的键值对。json 文件的具体格式如下，整体是一个字典，字典里。输出txt包含所有图像对应的YOLO格式txt文件，还包含一个类别信息class.txt文件。注意，中心点坐标的值、宽度和高度均为归一化后的，取值范围为[0,1]。YOLO格式txt文件由2部分组成，分别是类别信息和边界框信息，由0，1, 2 等数字依次增加，边界框为。

2025-02-11 10:15:30 221