【论文笔记】Uninformed Students: Student–Teacher Anomaly Detection with Discriminative Latent Embeddings

aoi_aoi

于 2023-11-23 15:38:17 发布

阅读量351

点赞数 1

分类专栏：论文学习文章标签：论文阅读计算机视觉人工智能

本文链接：https://blog.csdn.net/m0_53546362/article/details/134573903

版权

论文学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

会议：CVPR 2020

链接：[1911.02357] Uninformed Students: Student-Teacher Anomaly Detection with Discriminative Latent Embeddings (arxiv.org)

作者：Paul Bergmann, Michael Fauser, David Sattlegger, Carsten Steger

摘要

学生网络 经过训练，可以对描述性教师网络的输出进行回归。

教师网络 是在自然图像的大型补丁数据集上进行预训练的。通常情况下，预训练的目的是通过大规模的未标注数据来学习特征。

当学生网络的输出与教师网络的输出不同时，就会检测到异常。

当学生网络遇到不在其正常训练数据范围内的情况时，可能会产生异常，因为它无法有效地处理这些新的、异常的情况。

简介

解决的问题：现有方法在处理大型高分辨率图像数据集时所面临的两个主要问题，对特征空间的降维需求以及对训练数据的大量子采样，这限制了它们在这个特定背景下的性能。

提出的解决方案

通过学生-教师方法来隐式建模训练特征的分布： 为了克服浅层模型的限制，提出了一种方法，即通过学生-教师方法（student–teacher approach）来隐式地建模训练特征的分布。学生-教师方法通常涉及使用一个深度神经网络作为教师，该网络已经在大量数据上进行了预训练，然后将其输出作为目标来训练一个较浅的学生网络。这种方法旨在利用深度神经网络的高容量来更好地捕捉训练数据的分布。
将异常检测看作特征回归问题： 在这个方法中，将异常检测视为一个特征回归问题。通过使学生网络的输出回归到教师网络的输出，可以在学生网络输出与教师网络输出之间的差异中检测异常。这种方法利用深度学习模型的能力来学习数据的复杂表示，并通过比较学生和教师的输出来寻找潜在的异常情况。

作者的贡献

作者提出了一种基于学生-教师学习的无监督异常检测的新颖框架。来自预先训练的教师网络的输出，充当学生群体的替代标签。
作者引入基于学生的预测方差和回归误差的评分函数，以获得密集的异常图来分割自然图像中的异常区域。并描述了如何通过调整学生和教师的接受域来扩展论文提出的方法，以在多个尺度上分割异常。
作者在三个真实世界的计算机视觉数据集上展示了最先进的性能。并将提出的方法与许多直接拟合教师特征分布的浅层机器学习分类器和深度生成模型进行了比较。最后，还将其与最近引入的基于深度学习的无监督异常分割方法进行了比较。

相关补充

$T$ is obtained by first training a network $\hat T$ to embed patch-sized images $p\in \mathbb{R} ^{p\times p\times C }$ into a metric space of dimension d using only convolution and max-pooling layers.

metric space 为度量空间；

embed … into 将什么嵌入；将一张图片嵌入到d维向量空间，其实就是将一张图片（大小为 $\times p \times C$ ）转为一个 $d$ 维的向量，用来表示它。

这句话的意思就是，教师网络 $T$ 是从 $\hat T$ 训练而来的，而这个 $\hat T$ 呢，是将 patch 大小的图像嵌入到一个低维的度量空间中，而这个度量空间的维度 $d$ 是通过通过最小化一个batch内的描述符相似度来增加紧凑度(compactness)同时减少不必要的冗余，ci,j表示相关矩阵的项：使用卷积和最大池化层进行训练得到的。

Discriminative Embeddings（判别性嵌入）： 指的是在嵌入空间中能够区分不同类别或样本的表示。这种嵌入通常通过训练网络来学习，以使相似的样本在嵌入空间中更接近，而不同类别的样本更远离。

augmented（增广）： 指的是对数据进行扩充或变换，以增加数据的多样性。对于图像数据，增广通常包括对图像进行随机变换、旋转、翻转、缩放等操作，从而生成具有差异性的训练样本。

对比学习——锚定样本交换（Anchor Swap）

通过随机交换训练中的锚定样本，引入一些随机性，以提高模型的鲁棒性和泛化能力。这个技术通常用于改进嵌入学习任务，其中目标是学习一个好的嵌入空间，使得相似的样本在空间中更接近。

具体来说，锚定样本交换包括以下步骤：

选择一个训练样本三元组： 一个训练样本三元组通常包括一个锚定样本（anchor）、一个正样本（positive，与锚定样本相似），和一个负样本（negative，与锚定样本不相似）。
随机选择一个训练样本的其他类别中的样本： 从训练数据中随机选择一个与当前锚定样本不同类别的样本。这个样本将成为新的锚定样本，原始锚定样本则成为负样本。
形成新的三元组： 使用新的锚定样本、原始正样本和原始负样本形成一个新的三元组。

这样，通过锚定样本交换，可以使模型在训练过程中更加鲁棒，因为它需要适应于更多的样本变化和随机性。这有助于提高模型的泛化能力，使其在未见过的数据上表现更好。在嵌入学习的上下文中，锚定样本交换常常用于改善学习到的嵌入空间，使得相似的样本更加接近，而不同的样本更远离。

方差、协方差与协方差矩阵

在统计学中，方差是用来度量单个随机变量的离散程度，而协方差则一般用来刻画两个随机变量的相似程度，其中，方差的计算公式为
$\sigma _{x}^{2}=\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x} )^2$
协方差的计算公式为：
$\sigma (x,y)=\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x} )(y_{i}-\bar{y})$
$\bar x$ , $\bar y$ 分别表示两个随机变量所对应的观测样本均值，据此，方差 $\sigma _{x}^{2}$ 可视作随机变量 $x$ 关于其自身的协方差 $\sigma(x,x)$ .

给定 $d$ 个随机变量 $x_{k}, k=1,2,...,d$ ,则这些随机变量的方差为
$\sigma (x_{k},x_{k})=\frac{1}{n-1}\sum_{i=1}^{n}(x_{ki}-\bar{x}_{k})^2$
对于这些随机变量，我们还可以根据协方差的定义，求出两两之间的协方差，即
$\sigma (x_m,x_k)=\frac{1}{n-1}\sum_{i=1}^{n}(x_{mi}-\bar{x}_m )(x_{ki}-\bar{x}_k)$
因此，协方差矩阵为
$\sum =\begin{bmatrix} \sigma (x_1, x_1) & \dots & \sigma (x_1, x_d)\\ \vdots & \ddots & \vdots \\ \sigma (x_d, x_1)& \dots & \sigma (x_d, x_d)\end{bmatrix}\in \mathbb{R} ^{d\times d}$
其中，对角线上的元素为各随机变量的方差，非对角线上的元素为两两随机变量之间的协方差。

在这里插入图片描述

aoi_aoi

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【论文笔记】Uninformed Students: Student–Teacher Anomaly Detection with Discriminative Latent Embeddings

学生网络经过训练，可以对描述性教师网络的输出进行回归。教师网络是在自然图像的大型补丁数据集上进行预训练的。通常情况下，预训练的目的是通过大规模的未标注数据来学习特征。当学生网络的输出与教师网络的输出不同时，就会检测到异常。当学生网络遇到不在其正常训练数据范围内的情况时，可能会产生异常，因为它无法有效地处理这些新的、异常的情况。解决的问题：现有方法在处理大型高分辨率图像数据集时所面临的两个主要问题，对特征空间的降维需求以及对训练数据的大量子采样，这限制了它们在这个特定背景下的性能。提出的解决方案。
复制链接

扫一扫