今日感悟:
“忙”
这几天会议比较多,忙的有点晕头转向的,还需要专注于核心业务。
夏天,终于要过去了
“攀比心”
看到朋友圈中熟人晒富贵,心中又生攀比心和不平之气,实不应该,
阳明先生说过:耻于动心尔。 戒之慎之!
今日学习内容:
1.2GitHub - CASIA-IVA-Lab/AnomalyGPT: The first LVLM based IAD method!
摘要:
中国科学院的研究人员已经开发出一种使用大型视觉-语言模型(LVLMs)来检测和定位工业图像中异常的新方法。这种名为AnomalyGPT的新方法采用图像解码器提供细粒度的语义信息,并使用提示学习器通过提示嵌入来微调LVLM。研究人员通过模拟异常图像并为每个图像生成相应的文本描述来生成训练数据。AnomalyGPT可以直接评估异常的存在和位置,消除了手动阈值调整的需要。它还支持多轮对话,并展现出令人印象深刻的少样本情境内学习能力。在MVTec-AD数据集上,研究人员取得了86.1%的准确率、94.1%的图像级AUC和95.3%的像素级AUC,达到了最先进的性能水平。
感想:
武汉人工智能研究院又一力作,之前的FASTSAM就曾拜读。思路别具一格,值得好好研究。
疑问:1.复杂背景的检测效果如何?
2.推理速度如何?
2.基于AidLux的工业视觉缺陷检测实战训练营 第二课
1.公开的算子优化导入开源模型的优化,后续要加强验证
2.基于评估图对训练样本的优化分析要掌握并推广出去