- 博客(279)
- 资源 (15)
- 收藏
- 关注
原创 【高光谱语义分割-HyperFree】HyperFree: A Channel-adaptive and Tuning-free Foundation Model forHyperspectral
本文提出HyperFree,首个无需微调的高光谱视觉基础模型。针对高光谱影像通道多变的特点,设计了全谱段可学习权重字典,支持动态构建嵌入层处理任意传感器数据。创新性地采用提示-掩码-特征交互机制,将特征距离作为语义相似度度量,实现单提示生成多语义掩码。通过构建的大规模Hyper-Seg数据集(5万图像/1544万掩码)进行预训练后,在5个任务11个数据集上达到与专用模型(5样本)相当的效果。该模型显著降低了计算成本,提升了高光谱解译的实用性。代码和数据集已开源。
2026-04-03 11:23:54
376
原创 【高光谱语义分割-DTSC(二)】:Dual-stage Hyperspectral Image ClassificationModel with Spectral Supertoken源码复现
北京理工大学团队提出双阶段高光谱图像分类模型DTSC,针对微小光谱变化和地物分布不均问题实现突破。论文发表于ECCV 2024并开源代码。复现需配置包含Torch 2.3、MMCV等组件的Python环境,支持ResNet/Swin/PVTV2三种骨干网络。数据需按WHU-OHS格式组织,预训练模型自动下载或从谷歌网盘获取。提供test.sh和train.sh脚本分别进行测试和训练,测试结果可视化展示预测与标签对比。训练模型默认保存在DataStorage目录,支持CUDA加速。该工作为高光谱分类提供了新的
2026-04-03 10:43:05
323
原创 【高光谱语义分割-DTSC(一)】:Dual-stage Hyperspectral Image ClassificationModel with Spectral Supertoken论文解析
北京理工大学许廷发团队提出双阶段光谱超像素分类网络(DSTC),创新性地结合光谱导数聚类与Transformer分类,有效解决高光谱图像分类中的边界模糊和区域不一致问题。该方法通过可微分聚类生成光谱超令牌,采用基于类比例的软标签监督,在保持精确边界的同时提升分类一致性。实验表明,DSTC在WHU-OHS等数据集上显著优于现有方法,计算效率达110.5FPS,兼具高精度与实用性。该成果发表于ECCV 2024并开源代码。
2026-04-03 09:50:34
488
原创 【工业场景】用YOLOv26实现4种输电线隐患检测
本文基于YOLOv26算法,针对输电线隐患识别任务进行研究,实现了对鸟窝、风筝、气球和垃圾四类隐患的检测。研究使用800张样本数据(训练集700张,验证集100张),采用YOLO目标检测格式进行标注。通过调整YOLOv26模型参数(nc=4)并加载预训练权重,完成了300个epoch的训练,最终获得最佳模型best.pth。实验结果表明该方法能有效识别输电线隐患,并提供完整的训练和推理代码流程。完整数据集和源代码可联系作者获取。
2026-02-03 16:43:46
931
原创 【工业场景】用YOLOv26实现8种道路隐患检测
本文介绍基于YOLOv26算法的道路病害检测方法。使用包含6000张图像的数据集(5000张训练,1000张验证),标注8类道路病害(裂缝、井盖等)。详细说明YOLO数据格式要求、数据集组织方式及模型训练过程,包括数据准备、模型选择、参数调整和预训练模型加载。最后展示训练结果和使用best.pt模型进行批量推理的代码实现,为道路病害自动检测提供完整解决方案。
2026-02-03 16:20:59
898
1
原创 【工业场景】用YOLOv26实现桥梁检测
本文基于YOLOv26模型实现遥感影像中的桥梁自动识别,包含完整技术流程。使用22648张2048×2048分辨率影像数据集,采用YOLO_OBB旋转目标检测格式(x,y,w,h,θ)。详细介绍了数据准备、模型配置(修改nc=1)、训练过程(300epochs)及推理代码实现。实验结果表明该方法能有效识别桥梁目标,训练生成的best.pt模型可用于批量检测。提供完整数据集和代码获取方式,为遥感目标检测任务提供实用解决方案。
2026-02-03 15:22:53
931
原创 【高光谱】HyperFree论文解读及代码复现
武汉大学团队提出HyperFree模型,一种无需调优的高光谱遥感影像基础模型,发表于CVPR 2025。该模型通过通道自适应嵌入层支持任意波段输入,并构建了包含41,900对样本的Hyper-Seg数据集。HyperFree在五项任务中表现出色,支持点提示交互推理,可视化结果显示其优于SAM等模型。代码复现包括环境配置、全自动推理和点提示分割功能,支持RGB和多光谱输入。该工作解决了现有模型需逐图调优的问题,显著提升了高光谱影像处理的灵活性。
2026-01-28 15:06:59
730
原创 SegEarth-OV系列(三):面向遥感图像的无训练开放词汇分割
SegEarth-OV3创新性地将SAM3模型应用于遥感图像的开放词汇语义分割任务,提出了双端掩码融合和存在性引导过滤两大核心策略。该方法无需训练即可实现精准分割,在17个遥感数据集上平均mIoU达53.4%,超越此前最佳方法12.7%,建筑提取任务IoU最高达86.9%。通过巧妙融合语义分割头的全局覆盖能力和Transformer解码器的实例细节捕捉能力,有效解决了遥感图像中密集小目标与大范围无定形区域共存的分割难题。实验表明,该框架在保持SAM3强大零样本能力的同时,显著提升了遥感图像分割的精度和泛化性
2026-01-27 15:40:53
760
2
原创 SegEarth-OV系列(二):面向遥感图像的无训练开放词汇分割
本文提出SegEarth-OV2模型,实现了开放词汇的遥感影像语义分割,特别针对光学和SAR图像的双模态处理。主要创新包括:1)SimFeatUp特征上采样模块,通过内容保留网络和11×11大核设计提升细节保留能力;2)Global Bias Alleviation机制消除CLIP模型的全局语义泄漏;3)AlignEarth跨模态知识蒸馏方法,将光学VLM知识迁移到SAR编码器。实验结果表明,该方法在YESEG-SAR数据集上取得一定效果,但仍有提升空间。代码已开源,支持后续研究和应用扩展。
2026-01-26 18:29:57
723
原创 SegEarth-OV系列(一):面向遥感图像的无训练开放词汇分割
最近开放词汇、zero_shot、文字提示等技术结合的遥感影像智能解译方向的新方法比较多,以SegEarth为代表的系列讨论的尤为热烈,今天就来看下李开宇博士最近的新成果,把SegEarth-OV系列的第一弹《SegEarth-OV:Annotation-Free Open-Vocabulary Segmentation for Remote-Sensing Images》进行论文详解和复现下,看下效果到底如何?西安交通大学CVPR2025SegEarth-OV 作为。
2026-01-23 20:12:53
770
原创 【检索定位】系列第二弹:Game4Loc解析,含论文和代码下载链接
【摘要】厦门大学团队在AAAI2025提出基于游戏仿真的无人机地理定位新方法。针对现有数据集小规模、单一场景及完美匹配假设的局限,作者构建了GTA-UAV数据集,通过游戏引擎生成3万+张多高度(80-650m)、多姿态的无人机图像,并创新性定义部分匹配机制(正样本IOU>0.39,半正样本IOU∈[0.14,0.39])。提出加权对比学习框架Weighted-InfoNCE,利用IOU动态调整损失权重,将检索精度R@1提升20.08%,定位误差降低234米。实验表明该方法在真实场景UAV-VisLoc
2025-11-18 11:47:26
923
原创 【geopandas】计算矢量iou
本文介绍使用Python的geopandas库计算两个矢量文件要素交并比(IoU)的方法。主要步骤包括:1)加载矢量文件;2)遍历要素判断相交情况;3)计算IoU值并根据不同条件分类统计。代码实现了对完全不相交、单要素相交(阈值0.7)和多要素相交(阈值0.5)等情况的分类计数,最后输出各类统计结果。使用前需确保安装geopandas库(pip install geopandas)且文件坐标系一致。文末附完整代码和程序员节祝福。
2025-10-24 20:16:58
399
原创 [YOLOv8] 用YOLOv8实现指针式圆形仪表智能读数(四)
本文详细介绍了如何将YOLO格式分割结果(TXT文件)转换为三值输入图(0,1,2)的方法。通过Python代码实现转换过程:1)解析YOLO格式标注文件;2)使用不同颜色标识不同类别;3)生成三值灰度图并保存。代码支持批量处理,用户只需替换输入输出路径即可运行。文中还提供了数据说明和可视化效果示意图,帮助理解转换过程。该转换是将分割预测结果转化为后续处理所需格式的关键步骤。
2025-10-22 11:17:20
465
1
原创 【工业场景】用YOLOv8实现行人识别
本文基于YOLOv8模型实现行人检测任务,使用包含78,298张图片的数据集(训练集77,706张,验证集8,592张)。详细介绍了数据准备、模型配置(YOLOv8m)、训练过程(300 epochs)及推理实现,最终达到80%以上的检测精度(AP50)。文中提供了完整的代码实现流程,包括数据格式转换、模型微调方法及测试代码,并开放数据集和源代码获取渠道。实验结果表明YOLOv8在行人检测任务中具有良好性能。
2025-10-13 15:55:05
1237
2
原创 【工业场景】用YOLOv8实现抽烟识别
本文基于YOLOv8模型实现抽烟行为检测,使用8573张样本数据(7719张训练集、854张验证集),采用YOLO目标检测格式。通过加载预训练模型yolov8m.pt,调整参数后训练300个epoch,最终获得85%以上的检测准确率。文章详细介绍了数据准备、模型配置、训练过程和推理代码,训练结果保存在best.pt模型中。完整数据集和源代码可通过私信获取。该方法能有效识别各种场景下的抽烟行为,为禁烟监管提供技术支持。
2025-10-13 14:16:52
1658
2
原创 【工业场景】用YOLOv8实现人员打电话识别
本文基于YOLOv8实现了一种人员打电话行为识别系统。研究使用包含11288张样本的自建数据集(训练集10160张,验证集1128张),采用YOLOv8m模型进行训练,通过迁移学习方式微调模型参数。实验结果表明,该系统检测准确率达到90%以上(AP50指标)。文章详细介绍了从数据准备、模型选择、训练过程到结果评估的全流程方法,包括数据集的YOLO格式转换、模型参数调整、训练日志分析等关键步骤,并提供了完整的训练和推理代码实现方案。该系统可应用于公共场所违规行为监控等场景。
2025-10-13 13:56:26
1045
原创 【gaussian-splatting】用自己的数据复现高斯泼溅(一)colmap安装bug记录
本文记录了在CentOS 7系统下安装colmap(用于高斯泼溅数据准备)的详细过程。作者首先介绍了colmap的功能及其在高斯泼溅中的作用,随后详细说明了安装环境(CentOS 7+CUDA 12.1+RTX 4090)。文章重点分享了安装colmap所需的依赖项(如ceres-solver、faiss等)的安装方法,以及通过源码编译安装colmap的具体步骤。最后提供了验证安装是否成功的方法。作者表示安装过程耗时2天,整理此文档旨在为遇到类似问题的开发者提供参考。
2025-08-14 10:28:06
1512
原创 【gaussian-splatting】用自己的数据复现高斯泼溅(二)
本文介绍了3D高斯渲染项目diff-gaussian-rasterization的环境配置、训练流程及结果查看方法。关键步骤包括:1)下载正确的3dgs_accel版本diff-gaussian-rasterization(避免main版本导致的参数错误);2)安装依赖库glm、simple-knn和fused-ssim;3)完成30000次迭代训练后,结果保存在output目录的point_cloud.ply文件中。重点提示:必须使用指定版本库,否则会报"antialiasing"参数
2025-08-06 19:33:01
1570
原创 【红外】用SIRST数据集复现图像小目标分割HCFNet-附数据集和python代码
红外小目标检测是一项重要的计算机视觉任务,涉及对红外图像中微小物体的识别和定位,这些图像通常仅包含几个像素。然而,由于物体的体积很小,而且红外图像中的背景通常很复杂,因此遇到了困难。在本文中,我们提出了一种深度学习方法 HCF-Net,该方法通过多个实用模块显著提高了红外小目标检测性能。具体来说,它包括并行补丁感知注意力(PPA) 模块、维度感知选择性集成(DASI) 模块和多扩张通道精简器(MDCR) 模块。PPA 模块使用多分支特征提取策略来捕获不同尺度和级别的特征信息。DASI 模块。
2025-05-13 14:25:58
1967
原创 【超分辨率】A Spectral Diffusion Prior for Hyperspectral ImageSuper-Resolution论文复现(含python代码)
论文提出了一种基于融合的高光谱图像(HSI)超分辨率方法,名为“Spectral Diffusion Prior(SDP)”,旨在通过融合低空间分辨率的HSI和高空间分辨率的多光谱图像(MSI)来生成高空间分辨率的HSI。
2025-05-06 16:08:52
975
原创 【红外】复现PIAFuison网络,含Python代码和数据集
红外和可见光图像融合旨在合成单个融合图像,即使在极端照明条件下,也能包含突出的目标和丰富的纹理细节。然而,现有的图像融合算法未能在建模过程中考虑照明因子。在本文中,我们提出了一种基于照明感知的渐进式图像融合网络,称为 PIAFusion,它可以自适应地保持突出目标的强度分布,并在背景中保留纹理信息。具体来说,我们设计了一个照明感知子网络来估计照明分布并计算照明概率。此外,我们利用照明概率构建照明感知损失来指导融合网络的训练。跨模态差分感知融合模块和中途融合策略。
2025-04-22 15:41:40
1091
1
原创 【HuggingFace】查找、下载数据和模型(小白都能会)
HuggingFace 被视为 AI 模型界的 GitHub,通过开放的社区文化和丰富的资源,推动了机器学习技术的普及和创新。:拥有超过 150 万个开源 AI 模型,涵盖自然语言处理(如 BERT、GPT)、计算机视觉、音频处理和多模态任务。通过以上步骤,就可以轻松查询和下载 Hugging Face 上的模型和数据集了,并在本地使用。:支持多种预训练模型,如 BERT、GPT、T5 等,适用于文本分类、生成、问答等任务。,旨在帮助开发者和研究人员快速使用、训练和部署 AI 模型。
2025-04-11 16:26:06
2019
原创 【工业场景】用YOLOv8实现非机动车及驾驶人佩戴安全帽检测
0:安全帽1: 驾驶人未戴安全帽2:驾驶人戴安全帽3:非机动车部分影像展示如下:label为txt格式的yolo目标检测格式,示例txt文件内容为:训练验证比例可以自行调整,这里不赘述。
2025-04-10 09:49:52
2263
原创 【工业场景】用YOLOv12实现饮料类别识别
饮料类别识别数据集为特定场景下的15种常见饮料,部分影像展示如下:label为txt格式的yolo目标检测格式,示例txt文件内容为:训练验证比例可以自行调整,这里不赘述。
2025-04-02 14:21:48
1751
9
原创 【Geoseg】工程复现+训练自己的数据
近年来,深度学习算法,特别是基于全卷积网络(FCN)的方法,在遥感领域变得非常流行。然而,这些方法通常在不同的数据集和深度学习框架中实现和评估,缺乏。
2025-04-01 15:54:07
2210
原创 【YOLOv12改进trick】DynamicTanh(DyT)模块引入YOLOv12,实现涨点和效率提升,含创新点Python代码
🍋模块🍋模块通过通过模仿(如tanh函数的S形曲线),在的情况下实现。🍋🍋:DynamicTanh即插即用适用于注意力块、FFN块和最终归一化层,尽管它可能看起来像是激活函数,但在这篇研究中不会改变原始架构中激活函数的任何部分,网络的其他部分也保持不变。🍋🍋:医学影像分割、语义分割、目标检测、图像分类🍋思路来源何恺明LeCun联手打造,论文已入选。
2025-04-01 09:36:47
599
原创 【TransAttUnet】 Multi-level Attention-guided U-Netwith Transformer for Medical Image Segmentation
本文介绍了一种名为的新型网络,该网络,并融合了和,旨在提高医学图像分割的准确性。文章详细阐述了TransAttUnet的设计原理、结构组成以及在多个医学图像分割数据集上的实验验证,并与其他先进方法进行了比较。
2025-03-21 10:08:56
1226
原创 【色调转换】应用于图像风格转换、匀光匀色等场景
首先看效果,支持SAR影像色调统一、光学遥感影像色调统一、自然影像色调统一。:色调参考图:待处理的图:色调转换后的处理结果图色调转换的算法将其封装成可执行程序exe文件,直接双击打开即可在软件界面上实现该功能。
2025-03-21 09:29:19
1021
原创 【YOLOv12改进trick】自注意力模块ScaledDotProductAttention(TSA)引入YOLOv12,实现涨点和效率提升,含创新点Python代码
🍋自注意力模块🍋🍋:ScaledDotProductAttention模块通过和表示来提高医学图像分割的准确性和效率。🍋🍋:在ScaledDotProductAttention中,用Transformer中的多头自注意力机制,能够捕获输入特征之间的长距离依赖关系,帮助模型理解,从而提高分割的准确性。。🍋适用场景🍋:医学影像分割、语义分割、目标检测、图像分类🍋。
2025-03-20 09:18:33
241
原创 【语义分割YOLO格式label可视化】YOLO格式txt文件label可视化,含python代码
第一部分为类别信息,用数字表示,从0开始第二部分为多边形边界坐标点信息,取值范围为归一化后的[0,1]示例语义分割的YOLO格式txt文件如下,共有2个目标对象:用python代码实现语义分割YOLO格式txt文件的label可视化成如下效果。
2025-03-12 17:09:28
653
原创 【从YOLO格式label中裁剪原图】根据txt格式检测结果或label文件从原图中裁剪出目标
依据目标检测结果框(YOLO格式txt)或label从原图中裁剪目标
2025-03-12 16:40:36
533
原创 【YOLOv12改进trick】通道聚合FFN模块ChannelAggregationFFN引入YOLOv12,实现涨点和效率提升,含创新点Python代码
即插即用模块 通道聚合FFN模块ChannelAggregationFFN引入YOLOv12,含Python代码修改
2025-03-10 15:10:16
639
原创 【YOLOv12改进trick】多节门控聚合模块MultiOrderGatedAggregation模块引入YOLOv12,实现涨点和效率提升,含创新点Python代码
多节门控聚合模块MultiOrderGatedAggregation引入YOLOv12,即插即用模块实现快速涨点
2025-03-10 14:39:28
524
原创 【YOLOv12改进trick】高效多尺度卷积注意力EMCAD_Block模块引入YOLOv12,实现涨点和效率提升,含创新点Python代码
EMCAD引入YOLOv12模块,实现高效多尺度注意力模块引入到YOLOv12中的快速涨点及效率提升
2025-03-10 14:05:00
724
原创 【YOLOv12改进trick】轻量级下采样ContextGuidedBlock_Down模块替换Conv模块,创新涨点优化,含创新点Python代码
ContextGuidedBlock_Down模块替换yolov12的Conv模块,实现快速涨点
2025-03-07 17:01:31
588
2
原创 【YOLOv12改进trick】优化loss函数(AdaptiveThresholdFocalLoss),含创新点Python代码,方便发论文
优化yolov12的损失函数
2025-03-07 16:11:37
1193
目标检测xml文件转txt文件
2025-01-07
经典Spring 框架(Java源码)
2023-12-21
GDAL-3.4.1-cp38-cp38-manylinux-2-5-x86-64.manylinux1-x86-64.whl
2023-06-14
DSFA算法数据集,可以直接用
2020-06-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅