吴恩达机器学习笔记之异常检测

最新推荐文章于 2024-04-10 20:24:04 发布

iblue_coffee

最新推荐文章于 2024-04-10 20:24:04 发布

阅读量860

点赞数 1

分类专栏：机器学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/blue_coffeei/article/details/87929425

版权

异常检测（anomaly detection）：

问题动机：

异常检测是一个常用的机器学习的算法，它虽然主要用于非监督学习问题，但是从某些角度来看，它又类似于一些监督学习问题。

以下面这组数据集为例，我们希望做的是，假设给定的数据集都是正常的，当给定一个新的样本时，我们判断它属于这组样本的概率可能性 p(x) 。

在上图中，越靠近中心蓝色圈的数据属于该组数据的可能性就越高，反之则越低。这种方法我们称之为密度估计，表达式如下：

模型 p(x) 为我们其属于一组数据的可能性，通过 $p(x) < \epsilon$ 来检测非正常数据。

异常检测的应用有：识别欺诈用户，检测数据中心是否有异常。

高斯分布（Gaussian （Normal）distribution）：

高斯分布也叫正态分布。一般记作X ~ N( $\mu , \sigma ^{2}$ )，~表示X服从什么什么分布，N表示正态分布。高斯分布的数学形式为：

它的图像是一个山坡形的曲线，

最低0.47元/天解锁文章

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
吴恩达机器学习笔记之异常检测

异常检测（anomaly detection）：问题动机：异常检测是一个常用的机器学习的算法，它虽然主要用于非监督学习问题，但是从某些角度来看，它又类似于一些监督学习问题。以下面这组数据集为例，我们希望做的是，假设给定的数据集都是正常的，当给定一个新的样本时，我们判断它属于这组样本的概率可能性。在上图中，越靠近中心蓝色圈的数据属于该组数据的...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。