【机器学习】利用Autoencoder进行无监督异常检测（含代码）

最新推荐文章于 2025-04-14 11:57:52 发布

旅途中的宽~

最新推荐文章于 2025-04-14 11:57:52 发布

阅读量4.7k

点赞数 34

分类专栏：机器学习系列文章文章标签：机器学习人工智能 Autoencoder 降维无监督异常检测

本文链接：https://blog.csdn.net/wzk4869/article/details/137523309

版权

本文介绍了Autoencoder，一种基于神经网络的无监督学习模型，用于数据降维和异常检测。通过实例展示了如何使用Keras构建Autoencoder在信用卡欺诈检测中的应用，包括数据预处理、模型训练与评估指标如MSE和MAE的使用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Autoencoder算法是一种常见的基于神经网络的无监督学习降维方法（其他常见降维方法）。

一、Autoencoder简介

Autoencoder，中文称作自编码器，是一种无监督式学习模型。本质上它使用了一个神经网络来产生一个高维输入的低维表示。Autoencoder与主成分分析PCA类似，但是Autoencoder在使用非线性激活函数时克服了PCA线性的限制。

Autoencoder包含两个主要的部分，encoder（编码器）和 decoder（解码器）。Encoder的作用是用来发现给定数据的压缩表示，decoder是用来重建原始输入。在训练时，decoder 强迫 autoencoder 选择最有信息量的特征，最终保存在压缩表示中。最终压缩后的表示就在中间的coder层当中。

以下图为例，原始数据的维度是10，encoder和decoder分别有两层，中间的coder共有3个节点，也就是说原始数据被降到了只有3维。Decoder根据降维后的数据再重建原始数据，重新得到10维的输出。从Input到Ouptut的这个过程中，autoencoder实际上也起到了降噪的作用。

在这里插入图片描述

二、Autoencoder无监督异常检测

异常检测(anomaly detection)通常分为有监督和无监督两种情形。在无监督的情况下，我们没有异常样本用来学习，而算法的基本上假设是异常点服从不同的分布。根据正常数据训练出来的Autoencoder，能够将正常样本重建还原，但是却无法将异于正常分布的数据点较好地还原，导致还原误差较大。

如果样本的特征都是数值变量，我们可以用MSE或者MAE作为还原误差。例如上图，如果输入样本为：
$X=(X_1,X_2,\cdots,X_{10})$
经过Autoencoder重建的结果为：
$X^R=(X_1^R,X_2^R,\cdots,X_{10}^R)$
还原误差MSE为:
$\frac{1}{10}\sum_{i=1}^{10}(X_i-X_i^R)^2$
还原误差MAE为：