自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

yezzy的博客

多模态质检文献学习

关注

文章平均质量分 96

关注数：文章数：1 文章阅读量：843 文章收藏量：16

作者: 香泥乐铁汁丶

一枚研究僧

展开

多模态视觉语言工业质检 InCTRL 模型论文解读

本文探讨了通用异常检测（GAD）问题，旨在训练一个单一的检测模型，该模型无需对目标数据进行任何进一步的训练，即可在不同应用领域的各种数据集中泛化检测异常情况。最近的一些研究表明，像 CLIP 这样的大型预训练视觉语言模型（VLM）在检测各种数据集中的工业缺陷方面具有很强的泛化能力，但它们的方法在很大程度上依赖于手工制作的缺陷文本提示，因此很难泛化到其他应用中的异常情况，例如医疗图像异常或自然图像中的语义异常。在这项工作中，我们建议使用少量正常图像作为样本提示，在不同的数据集上即时训练 GAD 模型。

原创 2024-08-02 10:50:23 · 844 阅读 · 0 评论