深度学习总结
文章平均质量分 90
blanokvaffy
深度学习调参侠
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
D-FINE-SEG: 将D-FINE改为实例分割模型 update1
本文介绍了将D-FINE模型改进为实例分割模型D-FINE-SEG的过程。作者在之前实现的基础上,补充了COCO数据集上的测试代码和MASK分数评估功能。主要内容包括对postprocessor.py文件的修改,添加了处理mask预测的相关方法:通过_gather_masks收集预测mask,使用_resize_masks_to_input将mask调整至输入尺寸,以及_resize_masks_to_orig将mask还原至原始图像尺寸。这些改进使模型能够输出实例分割结果,并为后续在COCO数据集上的性能原创 2026-04-07 10:41:58 · 274 阅读 · 0 评论 -
UniPCB:给 PCB 质检做一套真正统一的多模态基准
本文提出UniPCB,首个面向开放式PCB质量检测的统一视觉语言基准,并开发了专用模型PCB-GPT。针对现有PCB数据集碎片化、标准不统一的问题,UniPCB整合了6581张图像和23359组双语QA对,建立了统一的缺陷分类体系和任务框架,涵盖三种场景14类子任务。PCB-GPT基于Qwen2.5-VL-7B-Instruct,采用三阶段课程学习:概念对齐、指令微调和强化学习优化。实验表明,PCB-GPT在UniPCB上平均得分67.3,定位F1达51.1,显著优于开源模型,且在跨数据集测试中展现出良好泛原创 2026-03-25 15:59:13 · 335 阅读 · 0 评论 -
DitHub:把目标检测做成“Git 分支管理”
摘要: 论文《DitHub》提出了一种模块化增量学习框架,用于开放词表目标检测。传统方法将新知识压缩到同一套权重中,容易导致知识干扰和管理困难。DitHub借鉴版本控制思想,将不同类别/任务的知识拆分为独立模块(类似Git分支),支持按需组合。采用LoRA轻量化适配,通过两阶段训练(Warmup+Specialization)提升稳定性。实验表明,该方法在ODinW-13和新建的ODinW-O基准上均达到SOTA,兼顾增量学习与零样本能力。其核心价值在于模块化设计,支持灵活的知识增删改查,为持续学习提供了可原创 2026-03-22 21:03:47 · 337 阅读 · 0 评论 -
SAMSnake:让实例分割“沿着轮廓走”,而不是“往像素里涂”
SAMSnake:基于轮廓的实例分割新方法 这篇论文提出了一种新颖的实例分割方法SAMSnake,通过将目标表示为闭合轮廓曲线而非传统像素级mask。该方法采用三段式流程:首先用检测器定位目标,然后借助EfficientSAM生成初始轮廓,最后通过归一化偏移和动态匹配损失迭代优化轮廓形状。实验表明,该方法在Cityscapes、COCO等数据集上达到SOTA水平,特别擅长处理边界清晰度和复杂形状。相比传统方法,SAMSnake的优势在于边界更自然、计算更高效,且模块化设计便于下游任务扩展。这项研究为实例分割原创 2026-03-19 13:12:43 · 250 阅读 · 0 评论 -
Poly-DETR:用多边形检测 Transformer 重新定义实例分割
Poly-DETR提出了一种基于Transformer的多边形检测方法,将实例分割重新定义为稀疏顶点回归问题。该方法采用极坐标表示多边形,通过Polar Deformable Attention机制在圆周上采样特征,解决了传统密集掩码预测的计算冗余问题。核心创新包括极坐标参数化表示、位置感知训练策略和动态采样机制,在保持高精度的同时显著提升了计算效率。实验表明,Poly-DETR在Cityscapes等数据集上实现了实时高性能实例分割,为密集预测任务提供了新的解决方案。原创 2026-03-13 21:31:57 · 562 阅读 · 0 评论 -
工业缺陷检测的新范式:2025-2026年零样本检测技术全景扫描
摘要: 工业视觉领域面临缺陷样本稀缺、标注成本高等痛点,零样本缺陷检测(Zero-Shot Defect Detection)成为研究热点。2025-2026年的技术进展主要分为三类:1)视觉-语言模型(VLM)路线,如CLIP适配器跨域对齐热成像数据;2)数字孪生路线,通过CAD模型生成理想状态对比检测缺陷;3)基于CLIP的提示学习,如Crane模型通过上下文提示提升泛化能力。尽管实验室效果显著(如IoU达70%),但在真实工业场景(如MIRAD数据集)中性能平均下降29.78%,凸显跨域泛化仍是挑战。原创 2026-03-13 20:38:29 · 868 阅读 · 0 评论 -
目标检测原理简介
目标检测是一类计算机视觉任务,简单来说,目标检测可被定义为在计算机中输入一张图像,计算机需要找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,如图一所示。目标检测是计算机视觉领域的核心问题之一,相较于最原始的将整张图片分类为某一类别,目标检测不光可以感知图像中物体的类别,还可以提取感兴趣物体在图像中的位置信息,并将图片区分为前景和背景。随着科技的进步,目标检测算法广泛的利用深度学习作为基础,在近几年有了飞速的发展。目前,目标检测算法被广泛的应用于智能驾驶、安防摄像头、工业上的裂纹污损检测等工作。原创 2025-04-26 19:52:47 · 1009 阅读 · 0 评论 -
神经网络与计算机视觉
什么是神经网络(Neural Network)?神经网络又称人工神经网络(Artificial Neural Network,ANN)是机器学习(Machine Learning)中众多自适应优化算法的一种,其具有悠久的发展历史,最早可以追溯到上世纪40年代。神经网络通过搭建大量人工神经元并广泛连接形成网络,模拟生物神经系统对真实世界所作出的反应,以此为现实问题提出解决方案。那么什么是机器学习呢?原创 2025-04-26 19:45:13 · 1333 阅读 · 0 评论
分享