one-class svm单分类器使用初尝试

最新推荐文章于 2024-05-26 07:53:55 发布

不做渣岚

最新推荐文章于 2024-05-26 07:53:55 发布

阅读量1.5k

点赞数 4

分类专栏：单分类异常检测文章标签：分类算法 svm

本文链接：https://blog.csdn.net/qq_43140238/article/details/111870089

版权

本文介绍了如何使用one-class SVM（OC-SVM）进行异常检测。通过详细注释的代码展示了如何构建训练集，进行训练，预测，并绘制散点图和等高线来判断异常数据。OC-SVM在只有正常样本的情况下，用于识别测试集中不寻常的样本，区别于CNN的平衡样本训练。

摘要由CSDN通过智能技术生成

ocsvm单分类器使用

每部分代码都有注释，较为详尽了都能看懂。代码可见于开源中国ocsvm的讲解博客，其他很多站也能搜到，看起来还是比较直观步骤也比较清晰，核心的步骤都有，于是就挨个查了一下。

最终做了几个小地方的修改，主要是测试数据和数据个数的调整。

先说下目标，比如你一堆数据是一堆点很多坐标，都是正常数据（图中白色）利用其作为训练集，再有一些测试集的数据（有正样本（图中紫色）和负样本（图中黄色）），利用训练出的模型判定测试集样本是否为正常数据。

这和CNN就有差别了，CNN每个训练样本都有标签，知道哪些正样本哪些负样本，但两种样本数量相对均衡。这里就不均衡了，拿到的全是正样本需要找到异常数据，这就可以称之为异常检测（AD)。

看下这段代码，从结果看，输出的图片是散点图配上两类等高线，填充的等高线是判定区域之外的部分，红色（偏红那个，其实不是红色）部分是判定是否是异常数据的平面，也就是所谓的根据训练得到的分界线。

修改代码后运行截图

代码如下

'''
ocsvm1
'''
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.font_manager
from sklearn import svm

# linespace(start,end,num)在start和end之间均匀间隔生成的num个数
# meshgrid生成网格点坐标矩阵,xx,yy = np.meshgrid(x,y),xx与yy一一对应坐标数据
# 如xx,yy = np.meshgrid(x,y) x = [0,1,2] y = [0,1] xx = [[0,1,2],[0,1,2]] yy = [[0,0,0],[1,1,1]]
# xx和yy用于画等高线
xx, yy = np.meshgrid(np.linspace(-5, 5, 500), np.linspace(-5, 5, 500))

# Generate train data
# np.random.randn(d1,d2,...,dn),与np.random.rand(d1,d2,...,dn)生成[0,1)范围内的数据相似
# np.random.randn()符合标准正态分布N(0,1)以0为均值1为标准差，d均为生成数据的维度
X = 0.3 * np.random.randn(200, 2)
Y = 0.3 * np.random

最低0.47元/天解锁文章

不做渣岚

关注

4
点赞
踩
11

收藏

觉得还不错? 一键收藏
6
评论
one-class svm单分类器使用初尝试

ocsvm单分类器使用每部分代码都有注释，较为详尽了都能看懂。代码可见于开源中国ocsvm的讲解博客，其他很多站也能搜到，看起来还是比较直观步骤也比较清晰，核心的步骤都有，于是就挨个查了一下。最终做了几个小地方的修改，主要是测试数据和数据个数的调整。先说下目标，比如你一堆数据是一堆点很多坐标，都是正常数据（图中白色）利用其作为训练集，在有一些测试集的数据（有正样本（图中紫色）和负样本（图中黄色）），利用训练出的模型判定测试集样本是否为正常数据。这和CNN就有差别了，CNN每个训练样本都有标签，知道哪
复制链接

扫一扫

专栏目录