Coursera机器学习-第九周-Anomaly Detection

这篇博客探讨了异常检测在欺诈检测、入侵检测和医疗领域的应用,并通过密度估计建立异常检测系统。介绍了单变量和多元高斯分布在异常检测中的作用,以及如何构建和评估异常检测系统。此外,还提到了推荐系统在机器学习中的相关概念。
摘要由CSDN通过智能技术生成

Density Estimation


Problem Motivation

所谓异常检测就是发现与大部分对象不同的对象,其实就是发现离群点,异常检测有时也称偏差检测,异常对象是相对罕见的。
应用:

欺诈检测:主要通过检测异常行为来检测是否为盗刷他人信用卡。
入侵检测:检测入侵计算机系统的行为
医疗领域:检测人的健康是否异常
下面来看一个例子:
x1 : 引擎运转时产生的热量
x2 : 引擎的振动
将它们绘制成图表,假设某天新生产出一个发动机引擎,我们需要对它进行检测是否正常。如果 xtest 对应的特征向量与样本点类似,那么我们可以认为这个引擎是正常的;如果 xtest 对应的点在外面,离我们的样本点很远,则可以认为是一个异常点。

正式地定义异常检测问题:从 x(1) x(m) ,我们通常假定这m个样本都是正常的,或者说都不是异常的。然后我们需要一个算法来告诉我们一个新的样本数据x-test是否是异常。我们要采取的方法是给定训练集给定无标签的训练集。我们将对数据建一个模型 p(x) ,也就是说我们将对x的分布概率建模其中 x 是这些特征变量


p(x)<ε

则认为是异常样本点

p(x)ε
,
则认为是属于正常的


Gaussian Distribution

Gaussian Density:
这里写图片描述

图像如下:
这里写图片描述

其图像看起来像是一个钟,所以也成为钟型曲线。正态分布的期望 μ 决定了曲线的中心位置,标准差 σ 决定了曲线的宽度。如 μ=1 , σ=1 ,是标准正态分布,其图像如下:
这里写图片描述

下面看几个高斯分布的图像,理解一下参数

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值