Andrew Ng Machine Learning 专题【Anomaly Detection】

最新推荐文章于 2024-06-26 09:48:29 发布

IronYoung

最新推荐文章于 2024-06-26 09:48:29 发布

阅读量2.6k

点赞数

分类专栏： Machine Learning Machine Learning 课程笔记文章标签：机器学习多变量正态分布 Andrew-Ng Anomaly

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ironyoung/article/details/49334343

版权

此文是斯坦福大学，机器学习界 superstar — Andrew Ng 所开设的 Coursera 课程：Machine Learning 的课程笔记。力求简洁，仅代表本人观点，不足之处希望大家探讨。
课程网址：https://www.coursera.org/learn/machine-learning/home/welcome

Week 9 后半部分 Recommender Systems：http://blog.csdn.net/ironyoung/article/details/49340133

Week 9：

异常检测 & 高斯分布
1. 异常检测是一种介于监督学习与非监督学习之间的机器学习方式。一般用于检查大规模正品中的小规模次品。根据单个特征量的概率分布，从而求出某个样本正常的概率，若正常的概率小于阈值，即 $p(x)<\epsilon$ 视其为异常（次品）。正品与次品的 label 值 $y$ 定义为：
  
  $y = {01 if p (x) \geq ϵ if p (x) < ϵ$ $y= \begin{cases} 0& \text{if $p(x) \geq \epsilon$}\\ 1& \text{if $p(x) < \epsilon$} \end{cases}$
  如果某个样本由 $x_{1}, x_{2}$ 两个变量决定，如下图红色叉所示：
  
  同一个圆圈内部，表示的是成为正品的概率相同。越中心的圆圈内部正品率越高。越外层的圆圈内正品率越低。
2. 异常检测一般将每个特征量的分布假设为正态分布（如果特征量与正态分布差距很大，之后我们会提到方法对其进行修正）。为什么是正态分布？因为在生产与科学实验中发现，很多随机变量的概率分布都可以近似地用正态分布来描述（猜测正确的概率更大）。因此，以下稍微介绍一下正态分布的基础知识，如果很熟悉的同学可以略过这部分。
3. 正态分布（高斯分布），包含两个参数：均值 $\mu$ （分布函数取峰值时所对应横坐标轴的值），与方差 $\sigma^{2}$ （标准差为 $\sigma$ ，控制分布函数的“胖瘦”）。如果变量 $x$ 满足于正态分布，将其记为 $x \sim \mathcal{N}(\mu,\sigma^2)$ 。而取某个 $x$ 的对应正品概率为： p(x)=12π√σe−(x−μ)

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄12年

110
原创

99
点赞

298
收藏

199
粉丝

关注

私信

热门文章

分类专栏

最新评论

C++从零实现BP神经网络
lkd7608122: 应该是激活函数的偏导 https://blog.csdn.net/qq_45032868/article/details/90347731?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-1-90347731-blog-51039334.235^v28^pc_relevant_recovery_v2&spm=1001.2101.3001.4242.2&utm_relevant_index=4
Farneback 光流算法详解与 calcOpticalFlowFarneback 源码分析
weixin_44310412: 博主求一份farneback的博士论文可以不
Farneback 光流算法详解与 calcOpticalFlowFarneback 源码分析
范_先生2021: 博主您好，我下载不到Farneback博士的论文，能不能麻烦您发我一份博士的论文参考一下细节
YouTube-8M 数据集介绍与使用总结
大大蝌蚪: 啥意思呀？模型好用？？
C++从零实现BP神经网络
m0_46899234: delta表示的是误差吗？ outputLayer[i]->delta=(outputLayer[i]->value - outputLayer[i]->rightout) *(1 - outputLayer[i]->value)* outputLayer[i]->value; 如果是误差这段语句后面怎么还要乘(1 - outputLayer[i]->value)* outputLayer[i]->value;？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。