Andrew Ng Machine Learning 专题【Anomaly Detection】

此文是斯坦福大学,机器学习界 superstar — Andrew Ng 所开设的 Coursera 课程:Machine Learning 的课程笔记。力求简洁,仅代表本人观点,不足之处希望大家探讨。
课程网址:https://www.coursera.org/learn/machine-learning/home/welcome

Week 9 后半部分 Recommender Systems:http://blog.csdn.net/ironyoung/article/details/49340133

Week 9:

  1. 异常检测 & 高斯分布

    1. 异常检测是一种介于监督学习与非监督学习之间的机器学习方式。一般用于检查大规模正品中的小规模次品。根据单个特征量的概率分布,从而求出某个样本正常的概率,若正常的概率小于阈值,即 p(x)<ϵ 视其为异常(次品)。正品与次品的 label 值 y 定义为:

      y={01if p(x)ϵif p(x)<ϵ

      如果某个样本由 x1,x2 两个变量决定,如下图红色叉所示:

      同一个圆圈内部,表示的是成为正品的概率相同。越中心的圆圈内部正品率越高。越外层的圆圈内正品率越低。

    2. 异常检测一般将每个特征量的分布假设为正态分布(如果特征量与正态分布差距很大,之后我们会提到方法对其进行修正)。为什么是正态分布?因为在生产与科学实验中发现,很多随机变量的概率分布都可以近似地用正态分布来描述(猜测正确的概率更大)。因此,以下稍微介绍一下正态分布的基础知识,如果很熟悉的同学可以略过这部分。

    3. 正态分布(高斯分布),包含两个参数:均值 μ (分布函数取峰值时所对应横坐标轴的值),与方差 σ2 (标准差为 σ ,控制分布函数的“胖瘦”)。如果变量 x 满足于正态分布,将其记为 xN(μ,σ2) 。而取某个 x 的对应正品概率为: p(x)=12πσe(xμ)

异常检测综述是关于在不同的研究领域和应用领域中进行研究的一个重要问题。许多异常检测技术已经具体解决了这个问题的表述。不同的因素,如数据的性质、标记数据的可用性和要检测的异常类型等,会导致异常检测问题的挑战。通常,这些因素是由应用领域决定的,需要检测哪些异常。研究人员采用了统计学、机器学习、数据挖掘、信息论、光谱理论等不同学科的概念,并将其应用于具体的问题公式。通过图2可以看到与任何异常检测技术相关的关键组件。 与关于点异常检测技术的丰富文献相比,对上下文异常检测的研究相对有限。一般来说,这类技术可以分为两类。第一类技术将上下文异常检测问题简化为点异常检测问题,而第二类技术则对数据中的结构进行建模,并使用该模型来检测异常。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [Anomaly Detection_A Survey](https://download.csdn.net/download/juicymeng/10387314)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [异常检测综述(Anomaly Detection: A Survey)](https://blog.csdn.net/weixin_43883602/article/details/124472597)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值