【异常检测】XGBOD：用无监督表示学习改进有监督异常检测

最新推荐文章于 2024-01-26 21:50:54 发布

贝壳er

最新推荐文章于 2024-01-26 21:50:54 发布

阅读量2.3k

点赞数 1

分类专栏： paper研读文章标签：异常检测机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wlx19970505/article/details/113699679

版权

paper研读专栏收录该内容

3 篇文章 3 订阅

订阅专栏

论文来自于IJCNN 2018，本身结合有监督和无监督的思路比较直接，作为一个移植性比较好的框架，可以去尝试替换原论文中的一些Component，比如用更快的lightgbm替换xgboost,或者在无监督特征工程上尝试更多的组合。

无监督模型包括基于计算特征相似度，基于密度估计等方法。不同的模型学习到的是不同的数据模式，根据模型的打分去判断样本的异常程度，这里的分数其实体现了无监督模型本身的一个feature engineering的过程。作者针对有label的异常检测数据，使用无监督的方法扩展了原始数据的特征空间，辅助有监督模型探索到更多的特征模式。

Framework

在这里插入图片描述
首先由k个无监督模型学习原始数据，得到对各个样本的transformed outlier scores(TOS)，将TOS集合作为无监督模型组的特征工程输出，concat原本的特征作为有监督模型的特征输入：

作者实验室了对TOS集合的处理，发现取k个TOS的平均值效果不好，猜测TOS集合未必所有的TOS都是可用的，所以必须要对TOS集合作出筛选。同时考虑特征多样性和最终模型的准确度，作者给出的筛选思路如下：
在这里插入图片描述
其中，使用下面公式对准确度和多样性作出平衡：

下面公式为皮尔森系数，用来衡量不同量之间的相关程度。

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
【异常检测】XGBOD：用无监督表示学习改进有监督异常检测

论文来自于IJCNN 2018，本身结合有监督和无监督的思路比较直接，作为一个移植性比较好的框架，可以去尝试替换原论文中的一些Component，比如用更快的lightgbm替换xgboost,或者在无监督特征工程上尝试更多的组合。论文链接无监督模型包括基于计算特征相似度，基于密度估计等方法。不同的模型学习到的是不同的数据模式，根据模型的打分去判断样本的异常程度，这里的分数其实体现了无监督模型本身的一个feature engineering的过程。作者针对有label的异常检测数据，使用无监督的方法.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。