机器学习 鲁棒的基于高斯概率密度的异常点检测(novelty detection) ellipticalenvelope算法

本文介绍了机器学习中的鲁棒异常点检测方法——基于高斯概率密度的novelty detection(椭圆包络算法)。在不纯净的训练集中,该算法能有效找出偏离大部分数据的异常点。通过理解算法思想,即计算数据重心和方差,利用高斯概率密度评估每个点的异常概率,并借助scikit-learn库进行实现和展示。
摘要由CSDN通过智能技术生成

异常点检测分为novelty detection 与 outlier detection

鲁棒性的高斯概率密度是novelty detection, 就是在给出的数据中, 找出一些与大部分数据偏离较远的异常数据, 我们的训练集不是纯净的, 包含异常点 outlier detection 的训练集是纯净的

算法理解

这个算法的思想很好理解, 就是求出训练集在空间中的重心, 和方差, 然后根据高斯概率密度估算每个点被分配到重心的概率.

程序

调包侠决定使用 scikit-learn:

print(__doc__)

# Author: Virgile Fritsch <virgile.fritsch@inria.fr>
# License: BSD 3 clause

import numpy as np
from sklearn.covariance import EllipticEnvelope
from sklearn.svm import OneClassSVM
import matplotlib.pyplot as plt
import matplotlib.font_manager
from sklearn.datasets import load_boston

读取包中提供的数据

# Get data
X1 = load_boston()['data'][:, [8, 10]]  # two clusters
X2
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值