内含动画的PPT已经上传,可以在我上传的资源里看到,可免费下载
论文链接:https://arxiv.org/pdf/1903.07058.pdf
本篇文章发表于2019年AAAI上
(1)用半监督的方法进行异常检测;
(2)亮点在于不需要阈值,通过更低的重构误差进行分类;
(3)作者所用的方法CoRA(Competitive Reconstruction Auto-encoder),是一个竞争重构自编码器,一个编码器和两个解码器,其中一个解码器学习重建正常数据(正常解码器),另一个学习重建异常数据(异常解码器)
文章目录
![模型](https://img-blog.csdnimg.cn/20200404001128369.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1dhbmdaaXh1YW4xMTEx,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200404001213197.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1dhbmdaaXh1YW4xMTEx,size_16,color_FFFFFF,t_70)
一、论文概括
- 研究对象
- 目标
- 方法
- 结果
二、相关的研究工作
- 现有的研究工作
- 所存在的挑战
三、作者的研究方法
- 方法CoRA
- 竞争重构损失
- 保护结构正则化项
- 优化(SGD)
- 算法流程
(9.23)第二次阅读
一、核心思想:竞争重构自编码器
(1)训练数据和测试数据都用于学习,所有数据共享同一个编码器,但必须从两个不同的解码器中选择一个;
(2)编码器的目的是将正数据和未标记数据分别映射到子空间中;
(3)绿色虚线表示训练数据集和测试数据集中的正数据将被分配给内联解码器,而红色虚线表示异常数据(或异常值)的分配。
二、实验阶段
1、研究不同学习迭代下的inlier解码器和outlier解码器的重建结果
正样本被分配给内联解码器,离群样本被分配给离群解码器。
2、研究inlier解码器和outlier解码器之间重建残差的分布
(1)在初始化阶段,两个解码器对于正常值和离群值都有相似的重建误差,随着训练的进行,正常值和离群值的残差是不同的,经过大约50个迭代,学习过程开始收敛,内线和离群点之间的区别变得越来越明显。
(2)然而,由于总是存在一些异常值,这些异常值很难从正常值中分辨出来,因此存在一个很小的重叠区域。
3、CoRA的优点
(1)该模型不需要预先定义阈值来区分异常值
(2)它不存在过拟合问题
4、所用数据集(7个)
(1)KDD99
(2)MNIST
(3)Fashion MNIST
(4)ImageNet-20
(5)Caltech-101
(6)CIFAR-10
(7) Caltech-256