近期我对挖掘多维关联规则和Apriori挖掘事务数据的看法

最新推荐文章于 2024-04-03 22:46:22 发布

HashCodeWithJava

最新推荐文章于 2024-04-03 22:46:22 发布

阅读量8.9k

点赞数 1

分类专栏：学习和工作数据库与知识工程文章标签：算法数据挖掘数据库扩展

本文链接：https://blog.csdn.net/tangl_99/article/details/608813

版权

本文探讨了在数据挖掘中遇到的关联规则挖掘问题，特别是Apriori算法在处理事务数据集时的应用。作者指出，尽管Apriori算法在教材中以事务数据为例，但在实际多维数据场景下，需要将多维属性融合为事务进行挖掘。通过与指导老师的交流，作者提出多维数据可以转化为单维事务的观点，以适应Apriori算法的使用。

摘要由CSDN通过智能技术生成

这几天我对数据挖掘中的关联挖掘有不少的疑问，看了教材上的Apriori算法。但是在实际挖掘算法的实现上遇到了一些问题。Apriori算法在《数据挖掘：概念与技术》的教材上演示的是针对事务数据的挖掘，类似这样的{I1,I2,I3}这样的事务数据集，并不要求I1,I2,I3之间是在同一张表上。而挖掘多维数据，那么是指的多维属性，比如 buys(X,"beef") ^ buys(X,"beer") => buys(X,"fork")，买了牛肉和啤酒的人多半会买叉子这个规则上，都是buys这个属性下的数据，所以还是单维。而书上的例子，age(X,"20...29") ^ income(X,"20K...29K") => buys(X,"CD_player")这就是一个多个属性，多维的关联规则。而age,income,buys这几个属性可能在多张数据表上。

教材上主要由Apriori算法来讲解关联挖掘部分，其中是以事务数据来挖掘的。开始实施Apriori算法的时候，我面对的是一张张表，而不是事务数据，就不太明白如何使用Apriori了。后来考虑了一下，把表中的信息提取出来，融合成一个个的事务，那么进行关联挖掘的时候，对于Apriori算法来说，觉得根本不需要理会这个到底是多维还是单维的事务，多维的数据其实可以融合成一个事务。这只是我初步的想法，后来我就询问了毕业设计指导老师，下面是我和指导老师的通信：

------------------------------------------------------

XX老师：

我是唐良，是计算机学院2002级本科毕业设