2020李宏毅学习笔记——52.Anomaly Detection(2_7)

上节说的两种情况分别讲解:

1. Case 1: With Classifier

Example Application:判断卡通人物是否来自辛普森家庭在这里插入图片描述

  • 现在有数据及标签:

在这里插入图片描述

  • 然后要训练分类器:

在这里插入图片描述
有人做了这个分类器,准确率还不错:96%:在这里插入图片描述
根据这个分类器,来做异常检测。
而且呢,我们还要一个东西,就是信心分数,要根据这个信心分数来做异常检测。修改这个分类器,使其在输入人物是属于辛普森家庭中的哪一个,还要输出对分类结果的信心分数c
在这里插入图片描述
1.1 然后根据信心分数来进行异常检测:在这里插入图片描述
1.2 估计信心分数
由于Classifier的输出实际上是一个分布(softmax),所以会有:在这里插入图片描述
如果丢一张怪怪的图片:
在这里插入图片描述
也就是说softmax输出的最大值就是信心分数(上图中的红框)。
或者算分类几率的熵,熵越大说明越混乱,越无法确定分类。
其实用哪种方法没有很大差别,这里用第一种,方便:
在这里插入图片描述
在这里插入图片描述
由以上结果看到如果输入是辛普森家族中的人物,信心分数会比较高,反之比较低。
但是也有例外:在这里插入图片描述
但凡是出现机器识别错误的情况,一般都会把非辛普森家族人物识别为柯阿三
在这里插入图片描述
因为它是辛普森家族中唯一一个不是黄脸的人物,所以一旦出现非辛普森家族人物,机器认错的话就会认为是柯阿三。
上面的凉宫春日的头发是棕色,和柯阿三的脸颜色差不多,所以会出错。
在网上发布的辛普森数据集中,把所有数据丢到当前Classifier中得到的信心分数结果如下图:Confidence score distribution for characters from Simpsons :《辛普森一家》中角色的置信度分布:在这里插入图片描述
可以看到结果是非常集中的,当然也有错误的地方(红色)Confidence score distribution for anime characters:动漫人物的置信度分布:在这里插入图片描述
上面的丢随意的动漫人物进去得到的结果,丢了1万5千张,只有1400张左右是识别为辛普森家族人物。多数输入的信心分数比较低。
上面用分类器求信心分数的方法简单实用,是实作的首选,当然还有更复杂的方法:

4.Outlook: Network for Confidence Estimation

• Learning a network that can directly output confidence
在训练NN的时候就直接训练NN输出信心分数。(不展开)
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值