增量数据挖掘论文推荐

floatcqy

于 2011-09-08 19:48:35 发布

阅读量1.2k

点赞数

分类专栏：数据挖掘 fpgrowth cantree AFPIM 关联规则 FELINE 文章标签：数据挖掘算法数据库 transactions structure tree

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/floatcqy/article/details/6761495

版权

本文介绍了Cantree，一个针对增量数据挖掘的优化算法，对比了FELINE和AFPIM，指出Cantree只需扫描数据库一次即可构建，且在处理数据库更新时更为高效。尽管Cantree的树结构较大，但其查找过程适应性强。

摘要由CSDN通过智能技术生成

论文背景介绍

在基于Fp-tree的关联数据挖掘算法出现之前，人们对于增量数据挖掘已经做出了探索，但这些算法均是基于Apriori算法，所以很难应用于基于Fp-tree的增量数据挖掘。
本文引入了一个高效的增量数据挖掘算法，Cantree，通过实验对比已有的基于Fp-tree的增量数据挖掘算法FELINE和AFPIM，评价出各个算法的优劣以及它们的适用范围。

Fp-tree的改进算法

FELINE：该算法在存储上对Fp-tree进行了压缩，它的构造过程较为费时，适用于interactive mining，即“build once,mine many”.对于min_support_count经常变换的情况较为适合。
AFPIM：该算法适用于增量数据挖掘，因为数据库修改后，每个itemsets的support_count会改变，通过计算改变后数据库中1-itemset的support_count，并做一次重新排序。对排序后的结果通过冒泡排序的方法对原来的Fp-tree做一次更新维护。他的缺点是对于新的满足min_support_count的itemset没有更新进来，所以当加入足够多的transaction后，需要重新构建新的Fp-tre

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。