自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(116)
  • 收藏
  • 关注

原创 理解AUROC,AP,F1-scroe,PRO

AUROC(ROC曲线下面积)是评估二分类模型性能的重要指标,通过计算不同阈值下的真正例率(TPR)和假正例率(FPR)绘制ROC曲线。TPR反映正确识别正例的能力,FPR反映误判负例的比例。以疾病诊断为例,模型在不同阈值下计算TPR和FPR,连接各点形成阶梯状ROC曲线。曲线越靠近左上角性能越好,AUROC值越接近1表示模型区分能力越强。该指标综合反映了模型在不同阈值下的权衡表现。

2025-10-14 22:28:25 1431

原创 【AF-CLIP】的提示方案代码分析

本文总结了AF-CLIP模型提示(Prompt)部分的完整流程。流程分为三个主要步骤:1)输入类别描述文本(如"without defect."、"with defect.")并进行初始化,将文本转为token序列并创建可学习的prompt向量;2)将可学习的prompt向量与固定token embedding拼接,形成完整输入序列,并添加位置编码;3)通过Transformer对拼接后的序列进行编码,得到最终特征表示。整个过程存在两个主要缺点:固定的类别描述文本表达

2025-10-10 21:30:42 1066

原创 【多尺度/局部-全局融合与优化 】涉及的工业异常检测论文摘要整理

1.学习与对象无关的文本提示:无论前景对象如何,都能捕捉图像中的一般正常和异常-》专注于异常图像区域(×目标语义)+ 对不同类型的目标进行泛化的正常和异常识别。(1)自适应学习的细粒度描述(FG-Des):利用大型语言模型(LLMs)为每个类别引入细粒度的异常描述 + 采用自适应学习的文本模板。(2)位置增强的高质量定位(HQ-Loc):利用DINO初步定位、位置增强的文本提示。2.提取和聚合与文本对齐的窗口/补丁/图像级特征。3.提出少样本设置,利用普通图像的互补信息。

2025-09-23 20:56:20 1066

原创 【基于clip的工业异常检测的摘要整理】

本文摘要五篇工业异常检测前沿研究: SeaS(ICCV2025)提出统一生成模型,通过解耦异常对齐损失和U-Net特征融合,实现少样本异常生成,提升下游检测性能(AP+8.66%)。 KAG-prompt(AAAI2025)利用核感知层次图建模跨层视觉关系,增强少样本异常检测(AUROC指标显著)。 MVREC构建多视图区域-上下文框架,结合AlphaCLIP通用特征和少样本分类器,在MVTec-FS等数据集实现高精度分类。 Anomaly-OV首创零样本异常检测专家模型,通过125K指令数据集和LTFM机

2025-09-11 16:26:14 1266

原创 【CVPR24-工业异常检测】InCTRL:少样本基于上下文残差学习的通才异常检测

跟6种方法相比(SPADE【2020】,PaDiM【2020】,PatchCore【2022】,RegAD【ECCV2022】,WinCLIP【CVPR2023】,CoOp【CVPR2022】 没有24,25年的比较)2.视觉编码器中加入多层补丁级残差学习【黄色砖块,用处:捕获查询图像和少量正常图像的局部差异】+ 图像级残差学习【蓝色砖块,用处:捕获查询图像和少量正常图像的全局差异】输入: 测试图像 +目标数据集的少量正常图像 +文本提示。输出:测试图像的异常分数(是不是没有像素级异常检测)

2025-08-31 21:10:04 901

原创 【2025-工业异常检测】2025年基于clip模型的工业异常检测论文整理

本文总结了基于CLIP模型的零样本异常检测最新研究进展。Bayes-PFL提出贝叶斯提示流学习框架,通过概率建模提升跨类别泛化能力;AFR-CLIP通过异常特征矫正机制,将隐含缺陷信息嵌入文本提示;AF-CLIP则聚焦视觉特征优化,引入多尺度聚合机制。研究趋势显示:1)从手工提示转向概率化/可学习提示;2)视觉-文本双模态联合优化;3)医疗等特殊场景的适配器设计。未来方向包括开放词汇扩展、少样本优化及与闭集方法的性能差距缩小。这些工作推动了零样本异常检测在工业质检和医疗诊断中的应用。

2025-08-26 10:48:01 2183 1

原创 【ECCV2024】AdaCLIP:基于混合可学习提示适配 CLIP 的零样本异常检测

AdaCLIP:基于混合可学习提示的零样本异常检测方法 摘要: 本文提出AdaCLIP,一种基于CLIP的创新零样本异常检测方法。该方法通过引入混合可学习提示机制,包括静态提示(共享于所有图像)和动态提示(针对每个测试图像生成),有效增强了CLIP模型对异常检测的适应能力。AdaCLIP还在图像编码器末端添加投影层和混合语义融合模块,提高了异常定位精度。实验在14个工业和医学数据集上进行,结果表明AdaCLIP显著优于现有零样本方法,在图像级和像素级检测上分别提升3.7%和3.3%的性能。可视化分析进一步验

2025-08-04 22:02:01 1345 3

原创 【CVPR2024-工业异常检测】PromptAD代码(解析提示生成代码)

本文提出了一种基于CLIP模型的提示学习框架PromptLearner,用于自动生成和优化文本提示。该框架包含两个核心模块:正常提示生成器和异常提示生成器。通过随机初始化上下文向量并将其注册为可训练参数,系统能够动态优化提示内容。正常提示使用"N N N classname."格式构建,异常提示则结合通用模板和类别特有模板。模型通过不断调整上下文向量来提高图像与文本提示的匹配度,最终学习出最优的上下文表示。实验表明,该方法能有效提升图文匹配的准确性。

2025-08-03 16:10:02 912

原创 【CVPR2024-工业异常检测】PromptAD的运行(解析run代码)

本文提供了两个Python脚本(run_cls.py和run_seg.py)用于并行化训练分类和分割模型。两个脚本都采用多进程方式依次处理不同数据集和不同shot数的训练任务。run_cls支持1-shot、2-shot和4-shot设置,可处理Mvtec和Visa数据集;run_seg目前仅支持1-shot和Mvtec数据集,但可以扩展为多shot设置。脚本通过构造命令行参数调用对应的训练程序,利用进程池实现异步并行执行,提高了训练效率。两个脚本都包含完整的参数设置、命令构造和执行流程,适用于需要批量训练

2025-07-31 16:05:12 251

原创 【CVPR2025-工业异常检测】AA-CLIP:最新零样本工业缺陷异常检测模型

《AA-CLIP:基于异常感知CLIP的零样本异常检测增强方法》 摘要: 针对CLIP模型在零样本异常检测中存在的异常特征识别不足问题,本文提出AA-CLIP模型。通过双阶段适配策略,在保持CLIP原有泛化能力的同时增强异常识别能力:(1)文本空间引入异常感知锚点(如"完好零件/有裂纹零件")建立正常-异常语义区分;(2)视觉空间通过残差适配器实现补丁级特征与文本锚点对齐。实验表明,AA-CLIP在工业质检和医疗诊断数据集上达到最优零样本检测准确率,其创新性在于:解耦损失函数确保文本特征

2025-07-31 16:03:21 2716

原创 CLIP代码对应讲解

​CLIP训练训练策略:只看图像向量和文本向量是否配对,不预测具体词(一 只 猪,每个词都是一个token,不逐token配对)引入预训练模型modelgui.jpg​输出。

2025-06-25 16:45:31 257

原创 CLIP模型(含代码讲解)

CLIP是一种跨模态对比学习模型,通过图像-文本配对数据进行训练。其核心是让图像编码器和文本编码器学习对齐两种模态的特征空间:正样本(匹配的图像-文本对)特征接近,负样本(不匹配的对)特征远离。训练时使用大量网络爬取的图像及其自然语言描述,通过计算余弦相似度构建对比损失。推理时,将查询图像与候选文本描述(通过提示工程构建)编码后计算相似度,选择最匹配的类别。这种设计突破了传统视觉分类器的类别限制,实现了零样本识别能力。

2025-06-25 10:05:42 580

原创 怎么找模块

本文介绍了在Vision Transformer模型中替换注意力机制模块的具体步骤:1)通过谷歌学术搜索新注意力模块;2)选择开源的实现代码;3)定位目标模块类;4)创建测试文件并调试;5)确定输入特征维度;6)调整参数适配原模型。该方法提供了模块替换的系统流程,包括代码获取、测试验证和参数调整等关键环节,可有效实现模型改进。

2025-06-17 17:04:15 243

原创 模块缝合-把A模块换成B模块(没写完)

本文介绍了将MLP Head替换为KAN模块的具体步骤:1)在model目录新建Python文件并复制KAN代码;2)导入新建的KAN类;3)添加项目路径避免导入错误;4)在Block的__init__中初始化KAN层;5)在Transformer Encoder中找到MLP位置进行替换。整个过程涉及文件创建、代码移植、路径配置和模块替换等关键操作,通过KAN的三层结构([dim,64,dim])实现MLP的功能替代。

2025-06-08 21:24:34 301

原创 深度学习模块缝合

本文介绍了在Vision Transformer模型中集成SENet模块的三种方法:1) 在模型输入层加入SENet(通道数=3);2) 在Patch Embedding和Transformer Blocks之间加入(需将3维特征转为4维,通道数=768);3) 在MLP Head之前加入(需将2维特征转为4维,通道数=3)。每种方法都详细说明了通道数确定、特征维度转换和代码修改步骤,并提供了示例代码片段。重点强调了维度转换时通道数的匹配问题,通过打印特征形状来验证实现正确性。

2025-06-08 21:12:54 1191

原创 cursor的git版本控制(保留之前改好的版本,避免后面改完后找不到)

摘要:本文介绍了使用Cursor进行代码版本管理和Git配置的详细步骤。内容包括:运行代码的方法(点击三角按钮)、修改Python版本(通过Ctrl+Shift+P选择)、Git仓库初始化与版本切换、Gitee仓库创建与远程连接设置(需生成私人令牌)、代码提交与发布到远程仓库的操作流程,以及如何回滚到特定版本(使用git revert命令)。文中配有详细的操作截图,帮助用户完成从本地代码管理到远程仓库同步的全流程操作。

2025-06-04 12:29:17 4046

原创 cursor对话

本文介绍了智能代码助手Cursor的使用方法:1)通过Apply按钮将生成的代码应用到项目;2)代码修改显示为红绿对比,建议接受绿色修改;3)提供三种模式:Agent(自动处理)、Ask(问答)、Manual(人工编辑);4)自动补全功能和内嵌对话框操作(选中代码编辑或Ctrl+K生成)。特别说明当需要安装第三方库时应使用Agent模式,并可通过"accept all"一键接受所有建议。

2025-06-03 19:57:27 820

原创 配置cursor

Cursor代码编辑器界面与配置指南 摘要:Cursor是一款功能强大的代码编辑器,界面主要分为顶部菜单栏、左侧文件管理区、右侧编辑区和底部自动补全区。顶部菜单支持文件打开与管理,左侧提供文件浏览、搜索、Git管理和插件商店功能。编辑器支持Ctrl+I打开聊天界面,并具备智能补全功能。通过设置界面可以配置账户信息、选择AI模型(影响聊天功能)、调整自动滚动和代码审查选项。特别提供了代码质量检查功能,可自动检测语法错误、风格问题和潜在BUG,用户可选择是否需要代码审查。

2025-06-03 17:00:16 1805

原创 FiLo++的框架图介绍

FiLo++框架摘要:FiLo++是一个基于多模态融合的细粒度异常检测框架,通过文本与图像协同分析实现高精度定位。核心模块包括:1)文本生成模块(LLM生成带位置信息的异常描述);2)多尺度图像处理(CLIP编码器提取分层特征);3)特征对齐模块(可变形卷积MDCI融合跨模态特征);4)少样本支持(Memory Bank存储正常样本)。创新点在于细粒度文本提示、自适应多尺度交互与少样本增强定位,显著提升检测准确性。流程涵盖文本引导定位、特征匹配与分数融合,适用于工业质检等场景。

2025-05-04 19:13:53 1149

原创 【ACM MM会议-2024工业异常检测】FiLo++:融合细粒度描述和形变定位的零样本/少样本异常检测

写目前异常检测方法的限制需要大量目标类别的正常样本-》限制去快速适应场景提出零样本和少样本研究零样本和少样本不需要目标类的标记样本总结目前的零样本和少样本方法1.用多模态模型 2.比较图像文本相似度来检测异常指出目前零样本和少样本的研究缺陷1.通用描述无法捕获不同对象的异常 2.简单的补丁级图像-文本匹配不好定位不同形状和大小的异常区域提出自己的方法Filo++方法组成。

2025-04-13 16:45:31 520

原创 蓝桥杯赛前题

【代码】蓝桥杯赛前题。

2025-04-11 22:46:42 375

原创 填空题技巧2

用while 循环看末尾是0,/10去0,cnt+1。数据比较大-》用python。把每个数换成int类型存进去。

2025-04-11 11:31:17 433

原创 蓝桥杯填空题技巧

2.写函数,写每位数字原本有多少中可能,把18位数字相乘。3.灯管不亮-》原本为1,但熄灭了 或-》本来就不亮。1.用字符串数组存储(0-9)

2025-04-11 10:54:51 372

原创 【ACM MM 2024】FiLo++实验步骤总结

训练阶段步骤1:训练可学习模板•输入:正常/异常图像及其类别名称(III.B.2)•操作使用固定模板(如“A [domain] photo of [state][cls]”)与可学习文本向量结合。通过LLM生成细粒度异常描述,插入模板的字段。利用交叉熵损失优化可学习文本向量和适配器参数。•输出:优化后的可学习文本模板和适配器参数。•原文片段•含义:图像所属的领域或场景类别,用于关联特定应用场景的上下文语义。•作用:增强模型对不同领域(如工业、医学)的图像特征适配能力。•。

2025-04-02 20:21:42 963

原创 《PromptAD》实验步骤

◦ 图像级分数 (S_t = \frac{\exp(\langle z_t, \overline{w}^n \rangle)}{\exp(\langle z_t, \overline{w}^n \rangle) + \exp(\langle z_t, \overline{w}^a \rangle)})。: 生成正常原型 (\overline{w}^n) 和异常原型 (\overline{w}^a)。: 正常提示特征 (g(s^n))、异常提示特征 (g(s^m)) 和 (g(s^l))。

2025-03-29 10:56:04 1067

原创 蓝桥杯day1-时间问题

时间显示(蓝桥杯C/C++2021B组省赛)

2025-03-27 20:31:35 524

原创 蓝桥杯十天冲刺-day1(日期问题)

对于蓝桥杯所有的日期问题遍历,都可以使用的上。

2025-03-20 21:34:05 428

原创 【CVPR2024-工业异常检测】PromptAD方法(CLIP和提示学习)

3.1. CLIP and Prompt Learning(CLIP和提示学习):未知图像 + 多组文本提示(如 “a photo of [class]”):自动学习更有效的文本提示,提升CLIP在下游任务的表现。:优化后的文本提示,提升分类或检测性能(如异常检测)。:图像属于每个文本提示的概率分布,实现零样本分类。• 计算相似度得分:8(狗)、5(猫)、1(汽车)• 输入文字提示:“狗”、“猫”、“汽车”在异常检测中,通过学习正常提示。:少量正常样本(小样本设置):这张图大概率是狗!

2025-03-20 21:16:46 1235

原创 蓝桥杯十天冲刺-day1(getline读入空格)

解决cin或scanf无法读入空格的问题。

2025-03-15 16:45:00 410

原创 蓝桥杯十天冲刺(C++)-输入输出

cin/cout 与 scanf/printf。

2025-03-14 17:27:59 519

原创 每日一题-哞叫题(蓝桥杯)【模拟】

1.输入 N和F2.输入 竞赛字符串,把竞赛字符串放进字符串数组中3.设置 p,q指针,设置temp放移动前p所指的字符,设置25个位置的字符串数组B,设置res=04.设置循环,条件是q指向的不是字符串的最后一个字母。p指向第一个字符,q指向第二个字符5.如果p==q,则看temp中有没有放字符【有则看temp中的字符是否=q中字符,不是则把temp+p所指的字符两个按照首字母放在字符串B中且res++,没有则不放】6.如果p不等于q,则temp保留p所指的字符,且p和q各后移一格。

2025-03-05 15:37:56 493

原创 每日一题-奶酪题(蓝桥杯)【模拟】

假设有一个立方体奶酪,N=21✖1✖N的奶酪块有3种(x方向,y方向,z方向)如果x方向上想放 1✖1✖N的奶酪块,需要x方向上的有连续n个奶酪块被切走。同理,y方向和z方向也一样当 a(x,y)=n->z方向的(x,y)可以放1✖1✖N的奶酪块当 b(x,z)=n->y方向的(x,z)可以放1✖1✖N的奶酪块当 c(y,z)=n->x方向的(y,z)可以放1✖1✖N的奶酪块。

2025-03-03 19:17:08 521

原创 C语言赛前规划+必考知识点

第二周:可以先看填空题,对哪类题目不熟悉看哪类题目,整理规律看解析+自己打代码。

2025-02-23 20:15:35 231

原创 【CVPR2024-工业异常检测】PromptAD:与只有正常样本的少样本异常检测的学习提示

摘要写作总结:1.提出 两个关键点 (视觉语言模型【模型】+ 少量工业异常检测【方向】)2.想要解决的问题3.针对上述问题,本文提出了一种什么【方法】的什么【应用方面】方法【模型名】4.具体讲方法的步骤5.实验结果(挑好的讲)1.视觉语言模型 有助于解决 少量工业异常检测中需要设计大量提示信息的问题。2.传统提示学习方法不适用于异常检测这种单类情况(正常/不正常),适用于多类别问题(比如区分狗,猫,鸟等问题)

2025-02-23 16:52:10 2286

原创 蓝桥杯核心内容

质数与筛质数,分解质因数进制问题快速幕和乘法逆元二进制和位运算稍微介绍容斥(填空)组合数学。

2025-02-21 22:21:26 570

原创 蓝桥杯备考策略

(1-2周):基础算法+数据结构(3-5周):动态规划/贪心图论(6-8周):全真模拟+查漏补缺。

2025-02-20 16:49:55 1211

原创 8分钟入门 Overleaf & Latex-笔记

网址www.overleaf.com(不翻墙很可能很卡)1.点击2.通常是点击出现下面的页面3.上传对应的压缩包。

2025-01-10 20:50:09 1256

原创 运行MambaAD过程中遇到的问题

【代码】运行MambaAD过程中遇到的问题。

2024-12-25 21:44:02 855

原创 奇异值分解在图像压缩中的应用

奇异值矩阵在这里,第1个矩阵和第3个矩阵为正交矩阵中间的矩阵=奇异值矩阵,奇异值=7.7,2.6(7.7>2.6)

2024-12-24 20:01:44 971

原创 卷积神经网络-三维卷积

n×n×nc (通道数/深度)* f×f×nc ->(n-f+2)×(n-f+1)×nc’(使用的过滤器数量)

2024-12-23 15:36:56 511

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除