自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 基础篇--RGB-IR 双模态目标检测系列|手把手地教你利用YOLO训练双模态图像数据集

本文将手把手地教你利用YOLO训练双模态图像数据集,从环境部署、数据集的准备,修改yaml文件,直到运行成功!!!!

2026-04-02 20:19:31 1302

原创 精读双模态目标检测论文系列九|IM-CMDet 小目标精度暴涨 4.7%!模态内增强 + 跨模态对齐,无人机航拍全场景通杀!

本文摘要:无人机RGB-IR双模态小目标检测方法IM-CMDet(TGRS2025)创新性解决两大行业痛点:特征淹没与模态错位。该方法包含三大核心模块:DSJE模块通过高频细节与语义联合增强保留小目标特征;DFWG模块采用差分融合权重生成机制抑制背景噪声;FRN网络基于红外引导实现跨模态特征重建。在RGBTDronePerson等三大无人机数据集上全面超越SOTA,小目标检测精度提升1.41-4.7%,推理速度达19.2FPS。方法提供完整开源代码,支持YOLO即插即用,适用于无人机航拍、搜救安防等场景,为

2026-04-14 14:26:52 626

原创 精读双模态目标检测系列八|TGRS 顶刊力作!CMFADet 狂涨 4.02% mAP,空域频域双增强 + 通道交互融合,轻量 108FPS 缝合即涨点!

📝摘要:本文提出了一种轻量高效的航拍RGB-IR目标检测模型CMFADet,基于YOLOv11-OBB框架,针对双模态检测中的模态错位、特征退化等问题进行优化。模型包含四大核心模块:SFEM(空间-频域增强)、IR-AFAB(红外特征保护)、CIF(动态通道融合)和ATAH(任务感知对齐头),在DroneVehicle数据集上达到83.42% mAP@50,超越SOTA 4.02%,仅3.64M参数和108.7FPS推理速度,适合无人机实时部署。代码已开源,适用于遥感影像、低光照等复杂场景的旋转目标检测任

2026-04-13 16:12:36 650

原创 精读双模态目标检测论文系列七|西北工业大学力作!VG-CAB 模精度狂飙 99%!动态频率感知门控融合,碾压传统交叉注意力!轻量高效缝合即涨点!

摘要: 西北工业大学提出的LCAFNet创新性地解决了RGB-IR双模态目标检测的两大核心问题:传统交叉注意力的模态语义冲突和模型轻量化难题。通过模态引导交叉注意力(VG-CAB/IG-CAB),采用同模态生成Q/K、异模态提取V的策略,显著提升特征融合稳定性;结合轻量门控融合模块(GFB),模型参数量仅15.4M,在DroneVehicle、M3FD等5个数据集上mAP超越SOTA,夜间及低照度场景检测性能提升显著。实验表明,LCAFNet在保持高效推理(37.2G FLOPs)的同时,小目标检测精度提升

2026-04-12 12:48:00 772

原创 RGB-IR 双模态目标检测系列五|自创的3 种特征级融合方法全解析(附可运行代码 + 顶刊创新思路)

本文提出三种RGB-IR双模态目标检测特征融合方法:1)FourierBlock频域幅值相位加权融合,通过傅里叶变换解耦全局与细节特征进行加权;2)GatedMultimodalLayer门控像素级动态融合,采用Sigmoid生成自适应权重图;3)Freprocess频域解耦+通道注意力残差融合,实现三重特征增强。三种方法分别针对轻量化、平衡和高精度场景,均兼容YOLO系列框架。实验表明,这些方法在训练稳定性、推理速度和检测精度上各有优势,可为学术研究和工业落地提供灵活选择。创新点包括正交归一化频域融合、零

2026-04-11 14:46:38 756

原创 精读双模态目标检测论文系列六|MROD-YOLO 创新全解析(附可运行代码 + 二次顶刊创新思路)

本文介绍了一种针对遥感影像可见光-红外双模态小目标检测的轻量高效模型MROD-YOLO。该模型通过多模态联合表征网络(MJRNet)实现早期特征融合,采用感受野扩展机制(RFEM)和跨阶段部分空间注意力(C2PSA)增强骨干网络,利用多尺度迭代聚合模块(MSIA)优化特征融合,并精简颈部结构为FPN。在VEDAI和DroneVehicle数据集上达到SOTA性能,mAP50最高提升14.1%,参数量仅45.35M。文章还提出了三种二次创新方向:Mamba轻量化增强、RGB-IR弱对齐自适应模块和SAM-Li

2026-04-10 11:52:59 987

原创 精读双模态目标检测论文系列五|CCSFuse 创新全解析(附可运行代码 + 二次顶刊创新思路)

本文介绍IEEE TGRS 2025论文CCSFuse,提出一种无人机RGB-IR双模态目标检测框架。针对现有方法存在的模态信息失衡和特征冲突问题,CCSFuse设计了跨模态特征补偿模块(CMFC)实现噪声抑制和特征互补,以及自适应特征选择融合模块(AFSF)进行通道校准和动态融合。实验表明该方法在多个数据集上达到SOTA性能。论文还提供了6个二次创新方向,包括轻量化优化、极端天气增强等。开源代码基于YOLOv5实现,具有工程落地价值,为双模态检测提供了新思路。

2026-04-09 20:38:10 707

原创 精读双模态目标检测论文系列四|C²DFF-Net 架构的二次改进创新(附可运行代码 + 二次顶刊创新思路)

本文对C²DFF-Net双模态遥感目标检测模型进行了改进分析。实验发现:1)原模型的空间注意力增强模块(SpatialAttentionEnhancement)会引入噪声干扰,去除后参数减少且精度提升;2)通道注意力模块(ChannelAttentionEnhancement)保留有效,建议替换为KAN或CBAM增强非线性能力;3)跨域门控自注意力模块(CGSA)移除FFT操作后训练更稳定。提供了简化版CPCA、CDFIM和CGSA的改进代码,在保持核心功能的同时优化了模型性能。这些改进为双模态小目标检测提

2026-04-08 12:36:33 843

原创 精读双模态目标检测论文系列三|恶劣环境下的PE-Det创新全解析(附可运行代码 + 二次顶刊创新思路)

摘要:本文介绍了PE-Det模型,一种针对红外-可见光(IR-VIS)双模态目标检测的创新方法。该模型针对恶劣环境下可见光图像退化问题,提出了四大核心模块:先验引导可见光预处理(PVP)、多尺度动态专家融合(MDE)、跨尺度特征聚合颈部(GS-SSFF)和核心聚焦边界框回归损失(CFI-MPD-IoU)。PE-Det通过不对称预处理和动态融合策略,有效解决了跨模态不一致性问题。实验表明,该模型在FLIR和M3FD数据集上显著优于主流检测器,特别是在严格定位指标(mAP@0.5:0.95)上表现突出。论文还提

2026-04-07 16:38:18 648

原创 精读双模态目标检测论文系列二|CDC-YOLOFusion中CDS跨模态数据交换移植到YOLO系列代码中(附可运行代码 + 二次顶刊创新思路)

本文介绍了一种基于跨模态数据交换(CDS)的可见光-红外双模态目标检测方法CDC-YOLOFusion。该方法创新性地提出在训练阶段随机交换成对可见光/红外图像的局部区域,强制模型学习跨模态关联。通过双分支网络架构结合跨尺度动态卷积融合模块(CDCF)和模态交互损失,有效提升了复杂场景下的检测精度。实验证明该方法在多个数据集上达到SOTA性能,mAP提升2-3%。文章还提出了三个二次创新方向:自适应交换策略、轻量化融合模块优化和多尺度监督扩展,为后续研究提供了思路。配套提供了可直接复用的代码实现。

2026-04-06 19:57:01 689

原创 精读双模态目标检测论文系列一|C²DFF-Net 创新全解析(附可运行代码 + 二次顶刊创新思路)

本文提出了一种轻量级跨模态跨域差分特征融合网络C²DFF-Net,用于可见光-红外双模态遥感小目标检测。该网络以轻量化YOLOv8n为基线,包含三个创新模块:跨模态差分特征交互模块(CDFIM)强化模态间互补信息交互,跨域门控自注意力模块(CGSA)实现空间-频域联合特征融合,以及自适应光照感知掩码(ALM)训练策略平衡双模态权重。实验结果表明,该方法在仅6.58M参数和14.6GFLOPs计算量下,在三个权威数据集上达到85.7% mAP50的SOTA性能,并成功完成无人机机载部署验证。该方法在精度-算力

2026-04-05 16:44:08 810 4

原创 RGB-IR 双模态目标检测系列四|3 种特征级融合方法全解析(附可运行代码 + 顶刊创新思路)

本文介绍三种改进的双模态特征融合模块:1) DFF模块通过动态权重分配实现自适应融合;2) AFSF模块采用跨模态通道注意力校准特征;3) FEFM模块创新性地结合空间与频域特征建模。这些模块摒弃简单的特征拼接操作,通过注意力机制、MLP或频域变换实现精细化跨模态交互,能自动学习模态权重、强化目标特征并抑制噪声干扰。相比传统拼接方法,它们在保持轻量化计算的同时显著提升融合特征的判别性和鲁棒性,更适配YOLO等实时检测框架,对小目标和遮挡场景检测效果提升明显。所有模块均经过严格复现和工程适配,可直接集成到现有

2026-04-04 10:42:41 637

原创 RGB-IR 双模态目标检测系列三|3 种特征级融合方法全解析(附可运行代码 + 顶刊创新思路)

三个跨模态融合模块均摒弃简单拼接的浅层特征堆叠方式,通过通道注意力、空间注意力或自适应加权机制,实现 RGB 与红外特征的深度交互。相比直接拼接,这类结构能自主筛选关键信息、抑制背景干扰,使融合特征更具判别性,显著提升复杂场景下目标特征的表达能力。各模块均设计了针对性的跨模态信息交互方式,DEA 实现双向模态加权增强,CPCA 与 CDFIM 通过多尺度深度卷积捕捉空间结构,CIFusion 采用错位互补实现特征传递。

2026-04-03 16:12:43 577 2

原创 重磅改进--RGB-IR 双模态目标检测系列改进五|输入级融合,毕设 / 科研创新直接用(附代码)

本文提出了三种改进的双模态图像融合模块:1)基于隐式蒸馏的BDMF模块,通过跨模态动态门控实现双向特征交互;2)基于FiLM的BDMF_Modulation模块,利用全局仿射变换进行特征分布对齐;3)SCAF模块通过融合卷积实现跨模态特征交互。这些改进有效提升了双模态检测效果,具有即插即用、训练稳定等优势。文章提供了可直接运行的PyTorch实现代码,并分析了各模块的技术创新点,包括跨模态深度交互、隐式蒸馏、动态特征筛选等机制。后续将持续更新双模态检测的改进创新内容。

2026-04-01 10:25:57 1101

原创 RGB-IR 双模态目标检测系列改进四|输入级融合,毕设 / 科研创新直接用(附代码)

本文提出三种改进的双模态目标检测融合模块:1)CrossModalityMaskGen通过通道拼接和深度可分离卷积实现RGB与红外模态的交叉引导,增强边缘提取能力;2)BiDirectionalSpatialMaskGen利用空间池化实现极轻量的跨模态空间引导;3)CrossGuidedMaskGen采用"先验注入"机制,通过残差连接实现温和高效的双向特征互补。三种方案均突破了传统独立模态处理的局限,在保持轻量化的同时显著提升了小目标检测性能。代码可直接运行,后续将持续更新双模态检测的创

2026-03-31 11:44:57 601

原创 RGB-IR 双模态目标检测系列改进三|输入级融合,毕设 / 科研创新直接用(附代码)

第一种为基础增强型ECDM,在原始CDM基础上新增相似性分支,融合全局与局部差异,采用轻量注意力和非对称门控增强,轻量高效,为后续优化奠定基线。第二种为动态可靠性感知DACDM,引入模态置信度评估,抑制弱模态干扰,新增可学习温度系数,鲁棒性强,适用于模态不平衡场景,可作为SOTA对比版本。第三种为异构感知校准HCCM,用标准差归一化对齐模态尺度,以对比思想构建双特征,通过交叉互补增强,从分布对齐角度实现创新,便于理论验证。

2026-03-30 11:51:22 659

原创 RGB-IR 双模态目标检测系列改进二|输入级融合,毕设 / 科研创新直接用(基于Superyolo论文的MF模块进行改进-附代码)

基于Superyolo论文的MF模块进行改进-附代码

2026-03-29 14:11:22 175

原创 RGB-IR 双模态目标检测系列改进一|输入级融合,毕设 / 科研创新直接用(附代码)

本文提出三种改进的双模态融合模块:1) CIG模块通过跨模态交互门控和空间掩码生成增强特征融合;2) SSAF模块引入显著性引导的前置掩码机制;3) DMSAF模块采用双掩码架构分别处理RGB和红外模态。

2026-03-27 15:00:35 580

原创 RGB-IR 双模态目标检测系列二|2 种输入级融合方法全解析(附可运行代码 + 顶刊创新思路)

基于Superyolo中的MF模块,稍微修改SE模块或者创新一个注意力模块,这样就可以创新一个新的融合网络。基于ACDF-YOLO的跨模态差异融合CDM模块,基于CDM进行创新,不仅仅是相减,还有捕捉相似性,同时可以加上频域的操作.......这样修改创新度拉满。后续将进行更新!!!!以及进行二次创新,发顶刊必备。。。敬请关注!!!

2026-03-26 17:29:06 559

原创 RGB-IR 双模态目标检测系列一|3 种输入级融合方法全解析(附可运行代码 + 顶刊创新思路)

本文介绍了双模态检测中的输入级图像融合方法,包含三种可直接运行的代码实现:SuperYOLO的MF模块、BFM双模态融合模块和MEPF掩码增强融合模块。这些方法在像素级别处理RGB与红外图像,通过注意力机制、特征加权和全局压缩等技术实现多模态特征融合。文章提供了完整的PyTorch实现代码,并建议读者收藏关注后续更新。作者还提出可将这些模块进行组合创新,如替换注意力机制或融合不同模块,为发表高水平论文提供技术基础。文末提到将分享双模态检测相关论文资料。

2026-03-25 20:24:30 1007

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除