一种改进Apriori算法在农副产品价格中的应用

说明:本论文是读研期间攒写的一篇硕士论文,如有需要的朋友,请联系我:QQ 623736206

一种改进Apriori算法在农副产品价格中的应用

 

 ********

****大学计算机学院 北京 1000**

 

摘要:本文对关联规则提取中的Apriori算法进行了深入研究,指出了该算法的某些缺点,提出了一种改进的Apriori算法,提高Apriori算法挖掘效率。并将改进的Apriori算法应用于农副产品价格数据中,并与Apriori算法进行比较,结果表明该算法的性能明显优于Apriori算法。

关键字:关联规则  Apriori算法  频繁集

 

An Improved Application of Apriori Algorithm In The Data of Farm Produce’s Price

 

********

College of Computer Science, Beijing **** University, Beijing, China1000**

 

Abstract: This paper studies the association rules Apriori algorithm, and shows the disadvantage of this algorithm, and improves the efficiency of Apriori algorithm. Improved Apriori algorithm is applied to Agricultural products price data. Comparing with Apriori algorithm, the performance of improved Apriori algorithm is better than Apriori algorithm.

 

Keywords: Association RulesApriori AlgorithmFrequent Itemset

 

0、  引言


关联规则挖掘是数据挖掘中的一个重要的研究内容。但在众多的关联规则挖掘算法中,Apriori算法是最基本也是最著名的一种。其核心思想是基于频集理论的一种递推方法,目的是从数据库中挖掘出那些支持度和信任度都不低于给定的最小支持度阈值和最小信任度阈值的关联规则。Apriori算法通常分为两步:基于支持度,产生频繁项集;基于可信度,产生强关联规则。其核心是由生成的频繁项集。而Apriori算法的不足是需要对数据库进行多次扫描,候选项目数多,内存利用率低,以致影响运行效率。目前,众多学者针对Apriori算法的不足,提出了许多较好的改进或扩展方法,如DHP方法、Partition法、频繁闭项集法、FP-Growth算法、闭包项集格、TBAR算法、动态剪枝等。尽管这些算法各具优点且挖掘的性能和效率均明显高于传统的Apriori算法,但总的来说......

 

1、  Apriori算法及其思想

Apriori算法是一种寻找频繁项集的基本算法,即找到所有支持度不小于给定minsup的项集。其基本原理是使用一种称作逐层搜索的迭代方法,即用k-项集去探索(k+1-项集。

I={ , ,…, }为事务数据库Dm个不同项目组成的集合,其中的每一项目 i=1,2,…,m)相当于一种商品。W={ , ,…, }是一组事务集,W中的每个事务 i=1,2,…,n)是一组商品, 。每个事务T都有唯一标识TID。项目集中项目的个数称为项目集的维数或长度,若项目集的长度为k,称为k-项集。则对......

 

2、 Apriori算法的改进

2.1 事务数据的Hash表表示

提高Apriori的效率关键在于如何减少访问事务数据库的次数和减少候选项集在于如何减少访问事务数据库的次数和减少候选项集的产生。基于散列(Hash)技术的产生频繁项目集的算法,主要计算是在生成2-频繁项目集......

 

4、  结束语

本文对关联规则Apriori挖掘算法研究基础上......

 

参考文献

[01] Park J.Using a hash-Based method with transaction trimming for mining association rules[J]. IEEE Trans. on Knowledge and Data Eng.1997

[02] Tan P,Kumax V,Srivastava J.Selecting the right interestingness measure for association patterns. Technical

Report,2002

[03] 可,贺才望·基于Apriori算法改进的关联规则提取算法·计算机与数字工程

[04] 陈文庆,许 棠·关联规则挖掘Apriori算法的改进与实现·微机发展2005

[05] 刘以安,羊 斌·关联规则挖掘中对Apriori算法的一种改进研究·计算机应用2007

[06] 赵 松,孙立携·Apriori算法的改进·哈尔滨理工大学学报2007

[07] 王创新·关联规则提取中对Apriori算法的一种改进·计算机工程与应用2004

[08] 刘 巍,蒋 华·挖掘关联规则中Apriori算法的改进与优化·计算机与现代化2006

[09] 毛国君,段立娟等·数据挖掘原理与算法·清华大学出版社

[10] 章兢,张小刚·数据挖掘算法及其工程应用·机械工业出版社

[11] 梁循·数据挖掘算法与应用·北京大学出版社

[12] 陈文伟·数据仓库与数据挖掘教程·清华大学出版社

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值