LFR（Linear Four Rates）与HLFR(Hierarchical LFR)

最新推荐文章于 2024-06-26 09:47:18 发布

浴缸里看海

最新推荐文章于 2024-06-26 09:47:18 发布

阅读量448

点赞数

文章标签：机器学习论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46581637/article/details/132632637

版权

HLFR 方法是对LFR方法的改进，在LFR的基础上使用了hierarchical hypothesis技术。效果普遍比传统的DDM方法要好，主要体现在不会出现过多的false positive，以及对于imbalance class效果很好（因为监视的metric很多）。但是LFR和HLFR效果却差不多。

可改进部分：

这两种方法似乎都只能对binary classification有效
似乎没有使用windowing技术，可以通过设置窗口限制进入算法的历史时间步
在HLFR中，当permutation test否决LFR算法时，可以考虑加入自动调参

先来讲LFR(linear four rates)

这是一种漂移检测算法，four rates指的是由classifier的混淆矩阵所计算而来的四个参数

True positive rate/tpr：TP/(TP+FN)
True negative rate/tnr: TN/(TN+FP)
Positive predicted value/ppv: TP/(TP+FP)
Negative predicted value/npv: TN/(TN+FN)

主流的漂移检测算法(DDM,ADWIN)只关注模型的error rate，这导致此类算法无法检测出模型的召回率或者精确度降低，通过检测four rates，可以更全面的反映出模型性能的变化。

每当classifier收到新的数据并计算出一个相应的返回值时，总有两个rates会受到影响，记作这两个值受到 (返回值，真实值)的影响。

在classifier运行中，每次计算新样本都会出现两个被(返回值，真实值)所影响的rates，分别统计四个rates的出现次数作为经验速率(empirical rate).然后通过混淆矩阵计算classifier的precision（精准度）和recall（召回度），利用这两个metrics，然后通过Monte Carlo模拟来模拟出4个rates的历史分布，最后比较rates的统计值和历史分布之间的差异，如果差异显著，则代表检测到concept drift。

具体算法：

注：

R代表4个rates的统计量，注意R其实是4个值，并且计算R的过程中使用了时间衰减因子

P的计算其实就是精确度和召回度的计算，在tpr和tnr中，我们更关心召回度；在ppv和npv中，我们更关心精确度。之后通过BoundTable(不太理解这个算法)计算出warn.bd和detect.bd。

Evaluation:

由于监控了更多的metric，LFR的性能比起传统DDM算法有着很大提升，而且大量减少了false alarm

HLFR

在LFR的基础上加了一层，当LFR检测到drift时，在第二层使用permutation test方法进行二次验证，效果和LFR差不了太多，只能说进一步减少了false alarm。

ref：

1. Concept drift detection and adaptation with hierarchical hypothesis testing

2. Concept Drift Detection for Streaming Data

浴缸里看海

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
LFR（Linear Four Rates）与HLFR(Hierarchical LFR)

在classifier运行中，每次计算新样本都会出现两个被(返回值，真实值)所影响的rates，分别统计四个rates的出现次数作为经验速率(empirical rate).然后通过混淆矩阵计算classifier的precision（精准度）和recall（召回度），利用这两个metrics，然后通过Monte Carlo模拟来模拟出4个rates的历史分布，最后比较rates的统计值和历史分布之间的差异，如果差异显著，则代表检测到concept drift。在ppv和npv中，我们更关心精确度。
复制链接

扫一扫

浴缸里看海 CSDN认证博客专家 CSDN认证企业博客

码龄4年

5: 原创

198万+: 周排名

195万+: 总排名

1223: 访问

: 等级

51: 积分

0: 粉丝

1: 获赞

3: 评论

0: 收藏

私信

关注

热门文章

分类专栏

元学习 1篇
MAML 1篇

最新评论

论文阅读：Measuring internal inequality in capsule networks for supervised anomaly detection
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读：CSAL: Cost sensitive active learning for multi-source drifting stream
CSDN-Ada助手: 恭喜您写了第三篇博客！标题“论文阅读：CSAL: Cost sensitive active learning for multi-source drifting stream”非常吸引人！您对这一主题的深入探讨让人印象深刻。在这篇博客中，您展示了对CSAL的理解，并对多源漂移流中的成本敏感主动学习进行了分析。这确实是一个非常有趣和复杂的话题。我希望能在您的下一篇博客中看到更多关于该主题的实际应用案例或者实验结果的分享。您可以进一步探索CSAL在现实世界中的实际效果，并提供一些可行的解决方案或建议。此外，您还可以考虑添加一些相关研究领域的最新进展，以便读者能够更好地了解这个领域的发展动态。再次恭喜您的持续创作！期待在不久的将来能够阅读到更多精彩的博客文章。祝您在写作过程中愉快并不断进步！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
LFR（Linear Four Rates）与HLFR(Hierarchical LFR)
CSDN-Ada助手: 评论：非常欣喜看到您又一篇精彩的博客！您对LFR和HLFR的解释非常清晰，让我对分类器的运行过程有了更深入的理解。您在博文中提到的经验速率以及通过混淆矩阵计算精准度和召回度的方法确实很实用。除了您提到的内容，还有一些与该主题相关的扩展知识和技能，或许您也会感兴趣。例如，您可以了解一下机器学习中的模型评估指标，比如F1-score和ROC曲线。这些指标可以帮助您更全面地评估分类器的性能。另外，如果您对概念漂移检测感兴趣，可以进一步研究一下基于统计方法的漂移检测算法，比如Page-Hinkley和DDM算法。这些算法可以帮助您更准确地检测到数据流中的概念变化。再次感谢您的分享，并期待您未来更多精彩的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
论文阅读：Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。