- 博客(62)
- 资源 (1)
- 收藏
- 关注
原创 多模态目标检测
多模态目标检测因其增强的鲁棒性而备受学术界和工业界的关注。为弥补这一空白,本文对多模态检测中的融合退化问题进行了系统的理论研究,并指出了两个关键的优化缺陷:(1)在多模态架构下,单模态分支骨干网络的梯度被严重抑制,导致单模态分支优化不足;RSC模块和MD模块分别用于放大被抑制的梯度和消除模态间耦合干扰以及模态不平衡,从而实现对各模态骨干网络的全面优化。在 FLIR、LLVIP、M3FD 和 MFAD 数据集上进行的大量实验表明,所提出的方法能够有效缓解融合性能下降,并在多个基准测试中取得了最先进的性能。
2025-11-25 14:56:43
178
原创 多模态目标检测
多模态目标检测通过利用来自多个传感器模态的互补线索,提高了在复杂环境下的鲁棒性。我们提出了一种名为滤波多模态交叉注意力融合(FMCAF)的预处理架构,旨在增强RGB和红外(IR)输入的融合。FMCAF结合了频域滤波模块(Freq-Filter)来抑制冗余的光谱特征,以及基于交叉注意力的融合模块(MCAF)来提高模态间特征共享。
2025-11-25 14:48:24
152
原创 图像分割:Segment Anything (SAM)
模型的迅速崛起重塑了图像分割领域的格局,例如 Segment Anything (SAM) 等模型在各种视觉任务中展现了前所未有的通用性。然而,包括 SAM 及其后续版本在内的前几代模型在处理细粒度、低级分割挑战方面仍然面临挑战,例如伪装目标检测、医学图像分割、细胞图像分割和阴影检测。为了克服这些局限性,我们最初在 2023 年提出了 SAM-Adapter,并在这些复杂场景中取得了显著的进步。随着 Segment Anything 3 (SAM3) 的出现——SAM3 是一款更高效、性能更高的模型,采用了
2025-11-25 12:57:22
453
原创 VOC XML 旋转框 转换为 YOLO OBB 格式
VOC XML 旋转框 转换为 YOLO OBB 格式:输入:VOC XML (cx, cy, w, h, angle)输出:YOLO OBB (class_id x1 y1 x2 y2 x3 y3 x4 y4) - 归一化坐标
2025-10-26 21:54:57
273
原创 ccv.gapi_wip_gst_GStreamerPipeline | setNumThreads | no attribute ‘object‘
ccv.gapi_wip_gst_GStreamerPipeline | setNumThreads | no attribute 'object'
2025-09-27 21:39:37
767
原创 RTX5060 Ti显卡安装cuda版本PyTorch踩坑记录
这个警告的核心问题是:你安装的 PyTorch 版本过旧,其支持的 CUDA 计算能力(最高 sm_86)无法匹配 NVIDIA GeForce RTX 5060 Ti 的计算能力(sm_120,属于 NVIDIA 最新的 Blackwell 架构)。RTX 5060 Ti:属于 Blackwell 架构,计算能力为 sm_120,是 2024 年后推出的新显卡,需要支持该架构的 PyTorch 版本(通常是 PyTorch 2.3 及以上,且依赖 CUDA 12.4/12.5)。
2025-09-24 23:19:00
5321
5
原创 AttributeError: partially initialized module ‘cv2‘ has no attribute ‘gapi_wip_gst_GStreamerPipeline‘
【代码】AttributeError: partially initialized module ‘cv2‘ has no attribute ‘gapi_wip_gst_GStreamerPipeline‘
2025-08-31 18:45:28
134
原创 YOLOv11/12多模态(可见光+红外光,基于Ultralytics官方代码实现,可魔改网络)真实可信
2.3个开源 RGB+红外数据集(LLVIP、KAIST、M3FD),已全部对齐并制作为yolo格式,可直接训练。1.YOLOv11/12多模态(可见光+红外光,基于Ultralytics官方代码实现,可魔改网络)
2025-06-10 00:05:38
334
原创 Windows报错:OSError: [WinError 1455] 页面文件太小,无法完成操作的问题
Windows报错:OSError: [WinError 1455] 页面文件太小,无法完成操作的问题
2025-05-10 18:08:53
786
原创 将图片的尺寸缩放为原来的一半,同时保持原始的宽高比,而且不改变图片的质量,YOLO标签不变
将图片的尺寸缩放为原来的一半,同时保持原始的宽高比,而且不改变图片的质量
2025-04-27 00:10:49
186
原创 错误:empty() received an invalid combination of arguments
错误:empty() received an invalid combination of arguments
2025-04-05 16:18:06
382
原创 `AttributeError: partially initialized module ‘cv2‘ has no attribute ‘_registerMatType‘
`AttributeError: partially initialized module 'cv2' has no attribute '_registerMatType' 和ImportError: libGL.so.1: cannot open shared object file: No such file or directory
2024-12-28 21:37:58
393
原创 根据XML文件中前缀的信息,从对应的视频文件中提取指定的帧,并将这些帧保存为图像文件。具体步骤包括读取XML文件路径,查找对应的视频文件,设置视频捕获对象,读取指定帧,并将帧保存到指目录
根据XML文件中前缀的信息,从对应的视频文件中提取指定的帧,并将这些帧保存为图像文件。具体步骤包括读取XML文件路径,查找对应的视频文件,设置视频捕获对象,读取指定帧,并将帧保存到指目录
2024-11-06 11:16:45
246
原创 有哪位大佬跑过这两个数据集(ILSVRC2015_VID,visdrone2019 VID),求大佬
有哪位大佬跑过这两个数据集(ILSVRC2015_VID,visdrone2019 VID),求大佬
2024-11-04 17:14:07
425
1
原创 特征点检测与匹配是计算机视觉中的基础任务之一,广泛应用于图像配准、物体识别、运动估计、三维重建等领域。
特征点检测与匹配是计算机视觉中的基础任务之一,广泛应用于图像配准、物体识别、运动估计、三维重建等领域。
2024-10-07 17:45:21
1389
原创 对比两个文件夹中的文件名,以确保它们的一致性,并删除那些不匹配的文件
确保两个文件夹中的文件名一致,如果发现某个文件夹中的文件在另一个文件夹中没有对应的文件,则将这些文件删除,以便文件夹中的文件保持一致性。
2024-09-13 14:47:53
518
原创 SPPF创新改进为SPPF_UniRepLK,和UniRepLK注意力机制 能与YOLO系列结合进行创新
SPPF创新改进为SPPF_UniRepLK,能与YOLO系列进行创新
2024-09-11 10:04:36
1123
原创 yolov7结果生成的results.txt转excel文件,并且找到最大值的mAP@.5和mAP@.5:.95
【代码】yolov7结果生成的results.txt转excel文件,并且找到最大值的mAP@.5和mAP@.5:.95。
2024-09-04 20:32:44
446
1
MSTAR数据集,分为十类
2023-04-13
c语言/黑色星期五
2020-11-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅