论文题目:MCM: Masked Cell Modeling for Anomaly Detection in Tabular Data
论文链接:https://openreview.net/pdf?id=lNZJyEDxy4
1. 背景与动机
本文关注表格数据的异常检测任务。现有方法通常以单类分类的方式从只包含正常数据的训练集中抽取特征模式,然后在测试阶段将偏离这些模式的样本判定为异常。但由于表格数据的特征是异质的、复杂的、没有固定结构的,因此抽取它们的特征模式变得非常困难。
自监督学习方法常常通过创造辅助任务(pretext task)训练神经网络,以学习训练集中的特征模式,但这些辅助任务常被设计用于图像数据、语言数据的学习任务中,还没有工作将自监督学习中最流行且有效的方法 掩码图像/语言建模 用于处理表格数据的异常检测问题。
因此,在这篇文章中,作者提出掩码单元建模MCM来弥补这一缺失。**MCM通过生成多样的掩码,捕捉