前言
papers with code网站整理的在MVTec数据集上排名为2(截止博文发出时间)。
源码(非官方):https://github.com/gathierry/FastFlow
背景
获得全局和局部特征的方法:分布、多尺度、滑动窗口。典型分布有center of an n-sphere/Gaussian/KNN(k nearest neighbors)
思想:通过预训练网络获取正常图像特征,再利用统计学方法建模分布,通过分布做测试。Normalizing Flow是统计学方法的一种。训练的过程是不断拟合以达到这堆正常图像特征出现的最大概率。
FastFlow可以作为插入模块,使用不同的特征提取器(vision transformer(最后的一层特征就有较强的捕捉局部与全局关系的能力)or resnet)。
模型原理
感觉是Glow模型的修改,耦合层改动卷积块(交替的卷积核设计是为了平衡精确度和速度),排序层使用RealNVP模型的随机排序,大道至简吗。
研究一下Normalizing Flow里的Shuffle原理。
实验
对比实验:与不同模型对比执行速度,参数量,图像检测、定位精度;与不同模型在不同数据集上对比。
消融实验:选择不同的卷积核组合及不同的特征提取器做对比。
补充
论文提到的CutPaste(密度估计,多维高斯分布计算均值方差,使用聚类算法),vision transformer(能够学习全局和局部信息,两种典型方法Deit、CaiT)
参考:
FrEIA:https://blog.csdn.net/qq_41804812/article/details/124477478