机器学习:异常检测

在这里插入图片描述

问题定义

在这里插入图片描述
anomaly,outlier, novelty, exceptions

不同的方法使用不同的名词定义这类问题。

在这里插入图片描述

应用

在这里插入图片描述

二分类

在这里插入图片描述

假如只有正常的数据,而异常的数据的范围非常广的话(无法穷举),二分类这些不好做。另外就是异常资料不太好收集。

分类

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
每张图片都有标注,就可以来训练一个辛普森家族的成员分类器。
在这里插入图片描述
基于classifer来做异常检测。
在这里插入图片描述
基于信心分数来做异常问题,大于某值就是正常,小于某值就是异常
在这里插入图片描述
最大分数作为confidence
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
部分数据会有误判的情况

信心分估计

在这里插入图片描述
直接教网络信心分数,不仅是做分类任务C,也会给出信心分P

Train 和 Eval

在这里插入图片描述
100张辛普森家族图片,5张异常图片
在这里插入图片描述
在这里插入图片描述

  • 有蓝色的正常图被错误分类成异常
  • 有红色的异常图被错误分类成正常

这个时候用dev set上评估系统,这是一个二元分类问题。
在这里插入图片描述
正常异常比例的分布是非常悬殊的,这个系统可以有很高的准确率,但是没有做什么事,用acc准确率分类是没有意义的。

在这里插入图片描述
使用混淆矩阵:
在这里插入图片描述
在这里插入图片描述
cost table,做错的行为的代价,算一个分数:
在这里插入图片描述
在这里插入图片描述
针对自己的任务设定cost table。还有一些方法来衡量,比如AUC(roc曲线的面积)。

问题

在这里插入图片描述
在这里插入图片描述
脸上是黄的,然后系统给的分数就高,说明这个分类系统学到的并不是认清人,而是脸是否是黄的。

在这里插入图片描述
假设可以收到一些异常资料,可以学习在分类的同时,也给出异常的分数,但是这类数据不易收集。可以考虑使用GAN生成异常数据。

没有标签的场景

在这里插入图片描述
在这里插入图片描述
正常玩家和异常玩家(小白)

问题定义

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
需要数值化的方法来给每一个玩家的分数。 f ( 斯塔 ) f(斯塔) f(斯塔) 概率密度估计
在这里插入图片描述
高斯分布
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

uncle_ll

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值