t-Digest算法在异常检测上的应用#随笔模式#

最新推荐文章于 2024-06-21 09:40:06 发布

weixin_33834628

最新推荐文章于 2024-06-21 09:40:06 发布

阅读量1k

点赞数

文章标签： python

原文链接：https://juejin.im/post/59c12db7f265da066641380f

版权

异常检测中的阈值设定问题

异常检测通常有基于统计学习方法，基于机器学习方法，基于神经网络学习的方法等几种。
统计学习方法主要是通过设定阈值来判断统计量是否超出，如果超出，则判定为异常，反之，正常。

一般情况下，如果阈值选的较大，有可能出现漏报的情况，如果阈值选的较小，有可能出现误报的情况。（阈值的选定永远是误报与漏报之间的Tradeoff）

阈值选择的两种策略

Anomaly-Driven：

异常检测系统中为了尽可能地捕捉所有的异常，通常会设定一个阈值，与此同时会带来较高比例的误报，在检测系统中处理这样的误报，也会花费一定的人力。
通常设定一个阈值，然后计算此阈值下为处理误报所产生的“代价”，如果代价过高或过低，调整阈值，直至所产生的“代价”能够接受为止。

Budget-Driven：

与Anomaly-Driven相反，首先设定能够接受的“代价”。比如说，能够接受在300万检测中有3次误报，那么该阈值设定为99.9999%。

t-Digest算法在阈值选取中的应用

简单来讲，t-Digest算法主要是根据百分位数来确定阈值，如下图：

参考文献：

转载于:https://juejin.im/post/59c12db7f265da066641380f

weixin_33834628

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
t-Digest算法在异常检测上的应用#随笔模式#

异常检测中的阈值设定问题异常检测通常有基于统计学习方法，基于机器学习方法，基于神经网络学习的方法等几种。统计学习方法主要是通过设定阈值来判断统计量是否超出，如果超出，则判定为异常，反之，正常。一般情况下，如果阈值选的较大，有可能出现漏报的情况，如果阈值选的较小，有可能出现误报的情况。（阈值的选定永远是误报与漏报之间的Tradeoff）阈值选择的两种策略Anomaly-Driven：异常检测系统中为...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。