李宏毅机器学习之Anomaly Detection
要解决的问题
给定一个数据集,我们想要找到一个函数可以区分输入x是否相似于数据集
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/f9af0699f328413cef4abacda084afff.png)
什么是异常
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/818f3c4be43374b71c33732189db2b96.png)
异常侦测的应用
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/98fdc9ff5d12da474a177db36d6a39fe.png)
异常侦测的分类
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/1761d105831b4634c7a7055c2ee6bc55.png)
异常侦测的一般框架(有标签)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/9bd7c2f588b756842c96fae81c0f52aa.png)
异常侦测的一般框架(无标签)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/8192b253fced34738c927ec39b30be39.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/307696a8f09eee10f3c1a534ccb2e792.png)
那么假设数据点的分布满足高斯分布,那么就需要找到使
L
(
θ
)
L(\theta)
L(θ)最大的均值和方差。
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/c5ba410ca5db3378ac3fb462c1b053c5.png)
利用计算出的均值和方差,再利用验证集确定阈值来判断是否为异常。
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/6318843cebda9651f109cf717ab05c01.png)
Auto-encoder
利用autoencoder,test的时候如果还原出的图像与原图像差距很大,可以认为是异常值
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/b9af4bddef4beba61b23b5ef1e62a7e9.png)