AI-021: 吴恩达教授（Andrew Ng）的机器学习课程学习笔记61-68. Anomaly detection

铭记北宸

于 2018-11-03 22:16:43 发布

阅读量215

点赞数

分类专栏： AI 人工智能之路

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hanjingjava/article/details/83691615

版权

AI 同时被 2 个专栏收录

45 篇文章 1 订阅

订阅专栏

人工智能之路

36 篇文章 1 订阅

订阅专栏

本文是学习Andrew Ng的机器学习系列教程的学习笔记。教学视频地址：

https://study.163.com/course/introduction.htm?courseId=1004570029#/courseDetail?tab=1

异常侦测：

61. Anomaly detection – Problem motivation

New data is anomaly with old data. Anomaly data Possibility

Set a number , if new test point is bigger than it, the point is anomaly

针对一些特性建立针对某一期待预测状态的可能性模型

62. Anomaly detection – Gaussian distribution or normal distribution

曲线与x轴面积为1

Sigma越小，图形越高越尖；Mu是中心点位置；

参数估计问题：给出数据，估算高斯分布参数Mu 和sigma

参数估计有公式：

Maximum likelihood estimation极大似然估计

1/m或者1/(m-1)在数学上有区别，但实践中差别很小，只要有较大数据量m

63. Anomaly detection – Algorithm

二维数据图形化展示：

P(x)相当于三维图形中的高度：

64. Anomaly detection – developing and evaluating an anomaly detection system

用训练数据拟合模型，用交叉验证数据优化特征数量及sigma，最后用测试数据测试最终的模型：

65. Anomaly detection – anomaly detection vs. supervised learning

正样本数量太少负样本数量大，就很难从学习算法中获得模型，所以采用错误检测，从负样本中学习；

正样本数量大，比如垃圾邮件，我们有很多垃圾邮件，可以用监督学习；

66. Anomaly detection – choosing what features to use

数据用hist画直方图，不符合高斯分布的进行对数转化；log transport

或者其他方法转换，调整红圈内参数，使得数据更高斯分布：

octave 中正则化特征数据：

错误分析：当模型不能预测异常数据，就分析异常数据具备的特性，引入新特征，让算法从数据中提取新特征进行训练；

从没有标记出来的异常样本上找新特征；

选择特征：

CPU负载和网络负载比率，应该能反应正常与否，正常应该是正比；

67. Anomaly detection – Multivariate Gaussian distribution

图形分析，有些异常数据不能很好的标记出来：

可以采用多元高斯分布进行改进：

协方差矩阵正对角数值影响特征变化快慢；反对角数值影响x1=x2方向上的变化快慢；Mu是峰值位置；

68. Anomaly detection – Anomaly detection using the multivariate Gaussian distribution

According to the data set to calculate the mu and sigma:

多元高斯分布与原始的高斯分布：

原始高斯分布，是针对轴对称的，是多元高斯的特殊情况；

如果手动创建特征来引入单独特征之间的关系，可以用原始模型；
数据量大用原始
即使训练数据relatively small training set集很小，也能很好工作

多元高斯可以自动的引入单独特征之间关系；
耗费计算资源
训练数量要大于特征数量，最好大于10倍以上； sigma是可逆的；才使用多元；

当sigma不可逆，就尝试m大于10倍n，或者看看有没有等价、冗余的特征：x1=x2, x3=x4+x5…；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
AI-021: 吴恩达教授（Andrew Ng）的机器学习课程学习笔记61-68. Anomaly detection

本文是学习Andrew Ng的机器学习系列教程的学习笔记。教学视频地址：https://study.163.com/course/introduction.htm?courseId=1004570029#/courseDetail?tab=1异常侦测：61. Anomaly detection – Problem motivationNew data is anom...
复制链接

扫一扫

专栏目录

铭记北宸 CSDN认证博客专家 CSDN认证企业博客

码龄16年

125: 原创

5万+: 周排名

3万+: 总排名

15万+: 访问

: 等级

2582: 积分

145: 粉丝

134: 获赞

40: 评论

358: 收藏

私信

关注

热门文章

分类专栏

Java 5篇
SpringBoot 2篇
CTF 3篇
遐想 3篇
信息系统项目管理师 14篇
高项 9篇
项目管理 6篇
网络安全 2篇
MicroService 1篇
人工智能之路 36篇
AI 45篇
WebServer 1篇
Book 3篇
妙语摘录 18篇
Code 39篇
摘评 1篇
ProblemResolve 3篇
Hobby
UI 1篇
FAQ 4篇
IOT 3篇
OperationSystem 2篇
Docker 1篇
DevOpt 2篇

最新评论

SpringCloud微服务架构实战
endlesswater: 可以的，我看的另一个SpringCloud项目视频，从零开发，五天学会了SpringCloud项目实战：https://knife.blog.csdn.net/article/details/134659054
SpringBoot企业级开发
buxinagaofenle: 你好，网盘连接已经失效，能不能麻烦你再分享一下，谢谢
CTF-希尔加解密
CX330的烟花: 优质好文，内容丰富，条理清晰，思路明确，通透明了，宝藏博主，值得三连，期待更新～(￣▽￣～)~
SpringBoot企业级开发
铭记北宸: 解决了吗？项目有些久远，得靠你自己解决了。
SpringBoot企业级开发
abx678: 第十章的SecurityConfig extends WebSecurityConfigurerAdapter引不进去

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

铭记北宸 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。