2020李宏毅学习笔记——53.Anomaly Detection(3_7)

1.Example Framework真的没讲啥新的东西类。

小结一下辛普森家庭人物异常检测模型的框架:
在这里插入图片描述
训练的时候数据是都来自辛普森家族,调参的时候都要有。
Testing Set: Image x→x from Simpsons or not

2.Evaluation计算好坏:

上面的Dev Set部分要根据performance of f(x))来调整 λ ,下面来看怎么做:100 Simpsons,5 anomalies(红色).
在这里插入图片描述
最右边那个美女的信心分数是0.998,但是模型对于大多数的辛普森家族人物识别的信心分数是大于0.998的。
所以不是说有人物识别出来的信心分数很高就说这个分类器很烂,而是我们可以设置λ的阈值大于0.998,来确保其他人物的分类是非辛普森家族人物。

在这里插入图片描述

3.怎么评估一个分类器的好坏

Cost的判断,千万不要只看正确率
Accuracy is not a good measurement!
A system can have high accuracy, but do nothing.
因为异常值比较少。例如上图中的,如果5个异常值全部识别错误:
因为,可能5 wrong, 100 correct.比例悬殊,导致正确率很高,因此我们要分开来看,如果现在λ\lambdaλ在如下图所示的位置
在这里插入图片描述
那么我们可以根据异常值和正常值,是否被发现来做表格:4个没看出来在这里插入图片描述
在这里插入图片描述
这两个系统哪个好要取决我们对False alarm或是Missing的容忍度。
我们可以把容忍度做Cost表格A:扣分制
在这里插入图片描述
意思是异常值Missing记1分,正常值False alarm记100分,那么系统1的cost为104,而系统2的cost为603。系统1比较好
如果用另外一个Cost表格B:
在这里插入图片描述
意思是异常值Missing记100分,正常值False alarm记1分,那么系统1的cost为401,而系统2的cost为306。系统2比较好。
Cost表格B比较适合惩罚Missing的情况,例如癌症未检测比无并检测为癌症要严重。
Some evaluation metrics consider the ranking. For example, Area under ROC curve

根据不同的重点,取决于你要那这个系统来做什么事情。才能说到底是好还是不好

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值