增量数据挖掘论文推荐

本文介绍了Cantree,一个针对增量数据挖掘的优化算法,对比了FELINE和AFPIM,指出Cantree只需扫描数据库一次即可构建,且在处理数据库更新时更为高效。尽管Cantree的树结构较大,但其查找过程适应性强。
摘要由CSDN通过智能技术生成

论文背景介绍

  1. 在基于Fp-tree的关联数据挖掘算法出现之前,人们对于增量数据挖掘已经做出了探索,但这些算法均是基于Apriori算法,所以很难应用于基于Fp-tree的增量数据挖掘。
  2. 本文引入了一个高效的增量数据挖掘算法,Cantree,通过实验对比已有的基于Fp-tree的增量数据挖掘算法FELINE和AFPIM,评价出各个算法的优劣以及它们的适用范围。

Fp-tree的改进算法

  1. FELINE:该算法在存储上对Fp-tree进行了压缩,它的构造过程较为费时,适用于interactive mining,即“build once,mine many”.对于min_support_count经常变换的情况较为适合。
  2. AFPIM:该算法适用于增量数据挖掘,因为数据库修改后,每个itemsets的support_count会改变,通过计算改变后数据库中1-itemset的support_count,并做一次重新排序。对排序后的结果通过冒泡排序的方法对原来的Fp-tree做一次更新维护。他的缺点是对于新的满足min_support_count的itemset没有更新进来,所以当加入足够多的transaction后,需要重新构建新的Fp-tre
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值