一分类支持向量机(One-class SVM)是一种用于异常检测(outlier detection)和新颖性检测(novelty detection)的无监督学习算法。与传统的SVM不同,一分类SVM仅使用一种类别的数据进行训练,目的是在高维空间中找到一个最大边界超平面,将大部分数据点包含在超平面的一侧,从而识别出离群点或异常点。
基本概念
- 无监督学习:一分类SVM不需要标注的异常数据,它只需要一组正常数据来训练模型。
- 目标:训练模型以识别出与训练数据分布不同的样本,即异常点或新颖点。
- 决策边界:模型会尝试找到一个边界,使得尽可能多的训练数据位于该边界内,从而将异常点排除在外。
工作原理
一分类SVM通过以下步骤实现:
- 数据映射到高维空间:使用核函数(如线性核、径向基核(RBF)等)将输入数据映射到高维特征空间中。
- 找到最优超平面:在高维空间中找到一个超平面,将尽可能多的数据点包含在超平面的一侧,并尽量远离原点。
- 划定边界:根据超平面将数据点分为正常数据点和异常数据点。那些落在超平面另一侧的数据点被视为异常点。
数学公式
假设训练数据集为