工业异常检测大模型-Myriad:利用视觉专家进行工业异常检测的大型多模态模型 # 思路值得借鉴(海纳百川-有容乃大)

论文:https://arxiv.org/abs/2310.19070

代码:https://github.com/tzjtatata/Myriad

Myriad这个名字取得有格局


What Goal:

现有的工业异常检测(IAD)方法可以预测异常检测和定位的异常分数。然而,它们很难对异常区域进行多轮对话详细描述,例如工业异常的颜色、形状和类别。#(替换为线圈的xxx)

最近,大型多模态(即视觉和语言)模型(LMM)在图像描述、视觉理解、视觉推理等多种视觉任务上表现出了卓越的感知能力,使其成为更易于理解的异常检测的有竞争力的潜在选择。然而,现有的通用 LMM 中缺乏有关异常检测的知识,而训练特定的 LMM 进行异常检测需要大量的注释数据和大量的计算资源。(计算资源?)

本文提出了一种新颖的大型多模态模型,通过应用视觉专家进行工业异常检测(称为Myriad),从而实现明确的异常检测和高质量的异常描述。



贡献:

①  We propose a novel large vision-language model by applying vision experts for industrial anomaly detection termed by Myriad. By incorporating arbitrary existing IAD models as vision experts to provide prior knowledge, Myriad produces comprehensive descriptions of IAD task.

② We design Vision Expert Tokenizer to make LMMs can receive prior knowledge. An Expert-Driven Vision-Language Extraction module is further proposed to extract domain-specific vision-language representation to further achieve accurate anomaly detection.

③ Extensive experiments show that our proposed Myriad can receive prior knowledge from vision experts and further outperforms state-of-the-art methods on both MVTec-AD [1] and VisA [39] benchmarks.

How:

Why:

Reference

工业异常检测大模型来了!哈工大提出Myriad:利用视觉专家进行工业异常检测的大型多模态模型-CSDN博客

  • 5
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: shape_predictor_68_face_landmarks.dat是一个用于面部关键点检测的预训练模型文件,能够识别人脸的关键点位置。将其转换为OpenVINO格式需要以下步骤: 1. 下载并安装OpenVINO Toolkit:从Intel官方网站下载OpenVINO Toolkit,并按照其文档进行安装过程。 2. 使用Model Optimizer进行模型转换:打开命令行终端,进入OpenVINO安装目录下的"deployment_tools/model_optimizer"目录,执行以下命令: ``` python mo.py --input_model shape_predictor_68_face_landmarks.dat --data_type FP16 --output_dir converted_models ``` 这个命令将会转换预训练模型"shape_predictor_68_face_landmarks.dat"为OpenVINO识别的中间表示(IR格式)并输出到"converted_models"目录中。--data_type参数指定使用FP16数据类型进行模型转换。 3. 使用转换后的模型:转换完成后,可以使用OpenVINO的推理引擎来加载和运行转换后的模型文件。具体的代码可参考OpenVINO的官方文档和示例,使用适当的API调用来进行人脸关键点检测任务。 通过以上步骤,你可以将shape_predictor_68_face_landmarks.dat模型转换为OpenVINO可用格式,并在OpenVINO环境中使用它进行人脸关键点检测任务。 ### 回答2: shape_predictor_68_face_landmarks.dat是一个用于人脸关键点检测的预训练模型,通常用于面部识别和面部表情分析等应用,它在dlib库中使用。将shape_predictor_68_face_landmarks.dat模型转换为OpenVINO格式,可以充分利用Intel的硬件加速来进行人脸关键点检测。 要将shape_predictor_68_face_landmarks.dat转换为OpenVINO,需要进行以下步骤: 1. 安装OpenVINO Toolkit:首先,需要根据OpenVINO的版本和操作系统类型,在相应的官方网站上下载和安装OpenVINO Toolkit。安装完成后,设置OpenVINO的环境变量。 2. 下载模型权重文件:前往dlib官方网站,下载shape_predictor_68_face_landmarks.dat预训练模型的权重文件。 3. 使用Model Optimizer进行转换:Model Optimizer是OpenVINO Toolkit中的一个工具,用于将各种深度学习框架的模型转换为OpenVINO的IR文件格式。打开终端或命令提示符,导航至OpenVINO目录的"deployment_tools/model_optimizer"文件夹。执行以下命令进行模型转换: ``` python mo.py --input_model <path_to_shape_predictor_68_face_landmarks.dat> --data_type FP32 --input_shape [1,3,224,224] --output_dir <output_directory> ``` 其中,<path_to_shape_predictor_68_face_landmarks.dat>为shape_predictor_68_face_landmarks.dat模型的路径,<output_directory>为转换后的IR文件存储目录路径。 4. 使用OpenVINO进行推理:转换完成后,在OpenVINO中使用转换后的IR模型进行人脸关键点检测。可以参考OpenVINO的官方文档和示例代码,了解如何加载和推理转换后的模型。 通过上述步骤,就可以将shape_predictor_68_face_landmarks.dat模型成功转换为OpenVINO格式,以便在支持OpenVINO的平台上进行人脸关键点检测。 ### 回答3: 要将shape_predictor_68_face_landmarks.dat模型转换为OpenVINO格式,需要执行以下步骤: 首先,确保已安装OpenVINO工具包并设置了正确的环境变量。 接下来,使用OpenVINO Model Optimizer来执行模型转换。可以执行以下命令: ``` python3 mo.py --input_model shape_predictor_68_face_landmarks.dat --output_dir <转换后模型保存目录> --data_type <数据类型> ``` 其中,`shape_predictor_68_face_landmarks.dat`是原始模型文件名,`<转换后模型保存目录>`是转换后模型保存的目录路径,`<数据类型>`是转换后模型的数据类型,如FP32、INT8或FP16。 执行上述命令后,OpenVINO会自动识别模型的输入和输出节点,并将其转换为OpenVINO格式。转换后的模型将保存在指定的输出目录中。 转换模型之后,可以使用OpenVINO的Inference Engine来加载和推理转换后的模型。可以使用以下代码片段来加载模型: ```python import cv2 from openvino.inference_engine import IECore # 加载OpenVINO推理引擎 ie = IECore() # 加载转换后的模型 net = ie.read_network(model='<转换后模型路径>.xml', weights='<转换后模型路径>.bin') # 加载模型到设备 exec_net = ie.load_network(network=net, device_name='<设备名称>') ``` 其中,`<转换后模型路径>.xml`和`<转换后模型路径>.bin`是转换后模型的路径,`<设备名称>`是指定的设备名称,如`CPU`、`GPU`或`MYRIAD`。 通过上述步骤,就可以将shape_predictor_68_face_landmarks.dat模型成功转换为OpenVINO格式,并使用OpenVINO进行推理和应用了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值