异常检测专栏(二):评价指标及常用数据集

前言 在上一篇推文中,我们认识到关于异常检测几种术语的概念和区别,并用一个广义OOD来描述异常检测的相关问题。此外,我们还了解到异常检测的相关应用、发展历程和当前异常检测技术的难点。本篇推文将继续回顾异常检测的基础概念,主要包括异常检测的评估指标和常用数据集。

本教程禁止转载。同时,本教程来自知识星球【CV技术指南】更多技术教程,可加入星球学习。

Transformer、目标检测、语义分割交流群

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV各大方向专栏与各个部署框架最全教程整理

目录

  • 常用数据集

    • MINIST

    • CIFAR-10

    • ImageNet

    • MVTec AD

    • Retinal OCT

  • 异常检测的评价指标

    • (1)TPR & FPR

    • (2)AUC-ROC

    • (3)AUPR

    • (4)Accuracy

    • (5)F-score

  • 下篇预告

常用数据集

异常检测常用的数据集主要包含:CIFAR-10/100、ImageNet、MNIST、MVTec AD、Retinal-OCT等。

MINIST

MNIST数据集下载链接

MNIST数据集是一个手写数字数据库,包含60000章28x28像素的训练图像和10000张测试图像,用于训练和测试基于图像的机器学习算法和深度学习算法。MNIST是深度学习领域中常用的一个经典数据库。

MNIST数据集的部分内容如下图所示:

CIFAR-10

CIFAR-10下载链接

CIFAR-10数据集是Tiny Image的一个子集,包含60000张32x32的RGB图像。这60000张样本被划分为50000张训练样本和10000张测试样本。

CIFAR-10数据集的部分内容如下图所示:

CIFAR-10中的图像被标记为 10 个相互排斥的类别之一:飞机、汽车(但不是卡车或皮卡车)、鸟、猫、鹿、狗、青蛙、马、船和卡车(但不是皮卡车)。每类都有 6000 张图像,每类有 5000 张训练图像和 1000 张测试图像。

ImageNet

ImageNet下载链接

ImageNet 数据集包含超1400万张带注释的图像,涵盖超过2万类的数据。自 2010 年以来,该数据集被用于 ImageNet 大规模视觉识别挑战赛 (ILSVRC),这是图像分类和目标检测的基准。ImageNet现已被广泛应用到深度学习的各个领域。

公开发布的数据集包含一组手动注释的训练图像。还发布了一组测试图像,其中保留了手动注释。ILSVRC 注释属于以下两类之一:

(1) 二进制标签的图像级注释,表示图像中是否存在对象类,例如,“此图像中有汽车”但“没有老虎, ”

(2) 图像中对象实例周围的紧密边界框和类标签的对象级注释,例如,“有一个螺丝刀以位置 (20,25) 为中心,宽度为 50 像素,高度为 30 像素”。

ImageNet数据集的部分内容如下图所示:

MVTec AD

MVTec下载链接

MVTec AD 是一个数据集,用于对侧重于工业检测的异常检测方法进行基准测试。它包含 5000 多张高分辨率图像,分为十五种不同的对象和纹理类别。每个类别包括一组无缺陷的训练图像和一组具有各种缺陷的图像以及无缺陷的图像。

MVTec数据集的部分内容如下图所示:

Retinal OCT

Retinal-OCT下载链接

Retinal OCT包含84,495张X光图像,其中包含CNV、DME、DRUSEN和NORMAL四种类别,其中每一个都与其他存在细微的差别。是医学图像异常检测任务中的一个常用数据集。

Retinal OCR数据集的部分内容如下图所示:

异常检测的评价指标

异常检测的评估指标一般包含以下几种:AUC-ROC曲线、TPR(真正率)和FPR(假正率)、Accuracy(准确率)、AUPR(Precision-Recall曲线下的面积)以及F-score分数。

为彻底理解上述几种评估指标,我们首先介绍混淆矩阵的相关概念

混淆矩阵:混淆矩阵中包含Positive、Negative、True、False的概念,其意义如下。

  • 称预测类别为1的为Positive(阳性),预测类别为0的则为Negative(阴性)

  • 称预测正确的为True(真),预测错误的为False(假)

对以上几个概念进行组合便可产生我们所熟悉的混淆矩阵:

除了以上的数据集之外,异常检测中使用的数据集还包括LSUN、Chest X-Rays、ELKI、OODS等。

(1)TPR & FPR

从混淆矩阵中派生出True Positive Rate(TPR,真正率)和 False Positive Rate(假正率)两个概念,定义为:

观察公式我们可以发现,其实TPR就是TP除以其所在的列和,FPR就是FP除以其所在的列和,二者的意义可理解为:

  • TPR是所有真实类别为1的样本中,预测类别为1的比例(我们希望这个值越大越好,实际上这也是召回率Recall的定义式)

  • FPR是所有真实类别为0的样本中,预测类别为1的比例(我们希望这个值越小越好)

(2)AUC-ROC

  • ROC曲线:是Receiver Operating Characteristic Curve的简称,其横坐标是假正率FPR,纵坐标是真正率TPR

  • AUC:是Area Under ROC Cure的简称,即ROC曲线下的面积。其意义为,随机从正样本和负样本中各选一个,分类器对于该正样本打分大于该负样本打分的概率。

下图展示了ROC-AUC曲线图:

(3)AUPR

  • PR曲线:横坐标为召回率Recall,纵坐标为精准率Precision,PR曲线完全聚焦为正例。

其中,Precision为精确率(表示真正预测为正样本的样本数占所有预测为正样本的样本数的比例),其定义公式为:

  • AUPR:是Area under the Precision-Recall Curve的简称,这也是一种独立的评价指标。

下图展示了AUPR曲线图:

(4)Accuracy

Accuarcy(准确率)是表示预测正确的样本占所有样本的比例,其定义为:

一般来说,Accuracy的值越高结果越理想。

(5)F-score

F-scroe是精确率Precision和召回率Recall的加权调和平均值。可以综合衡量Precision和Recall,其定义为:

一般来说,F-score的值越高结果越理想。

下篇预告

本篇推文我们介绍了异常检测的常用数据集和评估指标,到现在关于异常检测的基本概念相信大家已有一个整体的框架。接下来,从第三篇推文开始我们将进入专栏的第三部分:传统的异常检测方法。

 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群:470899183。群内有大佬负责解答大家的日常学习、科研、代码问题。

模型部署交流群:732145323。用于计算机视觉方面的模型部署、高性能计算、优化加速、技术学习等方面的交流。

其它文章

上线一天,4k star | Facebook:Segment Anything

3090单卡5小时,每个人都能训练专属ChatGPT,港科大开源LMFlow

Efficient-HRNet | EfficientNet思想+HRNet技术会不会更强更快呢?

实践教程|GPU 利用率低常见原因分析及优化

ICLR 2023 | SoftMatch: 实现半监督学习中伪标签的质量和数量的trade-off

目标检测创新:一种基于区域的半监督方法,部分标签即可(附原论文下载)

CNN的反击!InceptionNeXt: 当 Inception 遇上 ConvNeXt

神经网络的可解释性分析:14种归因算法

无痛涨点:目标检测优化的实用Trick

详解PyTorch编译并调用自定义CUDA算子的三种方式

深度学习训练模型时,GPU显存不够怎么办?

CV各大方向专栏与各个部署框架最全教程整理

计算机视觉入门1v3辅导班

计算机视觉各个方向交流群

ood数据检测方法是一种用于检测模型对于未见过的(out-of-distribution,OOD)数据的方法。在机器学习中,模型的性能通常是通过在训练集上的表现来评估的。然而,训练集往往只是整个数据分布的子集,模型在其他未见过的数据上的表现可能会出现较差的情况。因此,为了提高模型的泛化能力和鲁棒性,研究人员开始关注如何有效地检测和处理OOD数据。 研究背景包括以下几个方面。首先,现实世界中的数据分布通常非常复杂,包含各种未见过的变化和异常情况。如果模型只能处理已经在训练过程中见过的数据,那么它在面对未知变化时可能会出现错误的预测结果,从而导致严重的问题。其次,为了满足实际应用的需求,模型需要能够对OOD数据进行准确的识别和分类,而不仅仅是将其误认为训练集中的某一类别。 在过去的几年里,研究人员提出了许多方法用于OOD数据检测。这些方法包括但不限于基于置信度的方法、生成对抗网络(GANs)和可变性估计。基于置信度的方法通过对模型的输出概率进行分析来判断输入是否为OOD数据。GANs则通过训练一个生成器网络来模拟训练数据的分布,并利用生成器网络与模型的输出之间的差异来检测OOD数据。可变性估计方法则通过度量模型对于输入数据的不确定性来判断输入是否为OOD数据。 总之,OOD数据检测方法的研究背景是模型在面对未见过的数据时可能出现性能下降的问题。为了提高模型的泛化能力和鲁棒性,研究人员提出了各种方法用于有效地检测和处理OOD数据。这些方法的应用有助于提高模型在现实世界中的应用能力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值