【吴恩达机器学习-笔记整理】异常检测与高斯分布

🌵🌵🌵前言

✨你好啊,我是“ 怪& ”,是一名在校大学生哦。
🌍主页链接:怪&的个人博客主页
☀️博文主更方向为:课程学习知识、作业题解、期末备考。随着专业的深入会越来越广哦…一起期待。
❤️一个“不想让我曾没有做好的也成为你的遗憾”的博主。
💪很高兴与你相遇,一起加油!

一、异常检测

举例:
请添加图片描述
请添加图片描述

二、高斯分布/正态分布

公式:
请添加图片描述

不同参数模型:

请添加图片描述

参数估计(此处示例的是极大似然估计)

请添加图片描述

三、异常检测算法

异常分析算法详情:

请添加图片描述
请添加图片描述

图形示例:设置阈值,若计算p值小于该阈值,则视此为异常

请添加图片描述

四、异常检测系统(开发与评估)

评估异常算法

划分

训练集:无标签
交叉验证集和测试集为有标签。(用于评估准确率等)
请添加图片描述

建议选择下图第一种方式(常用做法),第二个选择是不建议的

请添加图片描述

算法评估:
设定不同的阈值,比较效果,如何选择较好效果的阈值

请添加图片描述

五、异常检测VS监督学习

异常检测:正负样本数相差巨大,有许多不同种类的异常(此数量较少,若通过使用监督学习,很难去学习到异常到底是什么,且将来出现的异常与已有的截然不同)
监督学习:正负样本数基本持平,或相差不大

请添加图片描述

六、选择要使用的功能

关于如何设计和选择异常检测算法的特征

1、变换为高斯分布

请添加图片描述

2、异常算法的特征

先根据训练集建立模型
再测试,将异常值找出,并以此建立新的特征来捕捉此异常

请添加图片描述

建立新的特征,帮助捕捉异常

请添加图片描述

七、多变量高斯分布

协方差矩阵

请添加图片描述
请添加图片描述

多元高斯分布的优点:可给数据的相关性建立模型

请添加图片描述

负相关
请添加图片描述
请添加图片描述

八、使用高斯分布的异常检测

请添加图片描述
请添加图片描述

多元高斯模型,在捕捉特征方面的关系有较多优点

多元高斯模型会自动捕捉不同特征之间的关系
原始模型计算成本比较低

请添加图片描述

当在拟合多元高斯模型的时候,若协方差矩阵为奇异矩阵(不可逆)时:

1、没有满足样本数m>n
2、存在冗余特征(两个一样的特征或者高度相关的特征,即线性相关)

请添加图片描述

❤️❤️❤️忙碌的敲代码也不要忘了浪漫鸭!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

怪&

感谢您的支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值