CSDN在线培训:大数据环境下的关联规则挖掘

原创 2014年04月02日 10:50:12

随着物联网和云计算这两大国家战略性新兴产业的不断发展,如何处理海量的信息以服务于社会的需求变得更为紧迫,数据挖掘技术成为推动两大新兴产业发展的核心技术。对于一些企业,数据挖掘更是可以带来更大的价值。

而关联规则挖掘(Association rule mining)是数据挖掘中最活跃的研究方法之一,可以用来发现数据之间的联系,关联规则挖掘过程主要包含两个阶段:

关联规则挖掘的第一阶段必须从原始资料集合中找出所有高频项目组(Large Itemsets)。高频的意思是指某一项目组出现的频率相对于所有记录而言,必须达到某一水平。一个项目组出现的频率称为支持度(Support),以一个包含A与B两个项目的2-itemset为例,我们可以经由公式求得包含{A,B}项目组的支持度,若支持度大于等于所设定的最小支持度(Minimum Support)门槛值时,则{A,B}称为高频项目组。一个满足最小支持度的k-itemset,则称为高频k-项目组(Frequent k-itemset),一般表示为Large k或Frequent k。算法并从Large k的项目组中再产生Large k+1,直到无法再找到更长的高频项目组为止。

关联规则挖掘的第二阶段是要产生关联规则(Association Rules)。从高频项目组产生关联规则,是利用前一步骤的高频k-项目组来产生规则,在最小信赖度(Minimum Confidence)的条件门槛下,若一规则所求得的信赖度满足最小信赖度,称此规则为关联规则。例如:经由高频k-项目组{A,B}所产生的规则AB,其信赖度可经由公式求得,若信赖度大于等于最小信赖度,则称AB为关联规则。

大数据分析挖掘培训课程要点及大纲

大数据分析挖掘培训课程要点-基于Hadoop/Mahout/Mllib的大数据挖掘 目前对大数据的分析工具,首选的是Hadoop/Yarn平台。Hadoop/Yarn在可伸缩性、健壮性、计算性能和成...
  • shenmanli
  • shenmanli
  • 2017年05月04日 15:04
  • 1658

关联规则挖掘及R算法实现

关联规则挖掘及R算法实现 关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。如果两项或多项属性之间存在关联,那么其中一项的属性就可以依据其他属性值进行预测。它在数据挖掘中是一个重要的课题,最近几...
  • sunbow0
  • sunbow0
  • 2014年12月16日 16:30
  • 8762

近期我对挖掘多维关联规则和Apriori挖掘事务数据的看法

   这几天我对数据挖掘中的关联挖掘有不少的疑问,看了教材上的Apriori算法。但是在实际挖掘算法的实现上遇到了一些问题。Apriori算法在《数据挖掘:概念与技术》的教材上演示的是针对事务数据的挖...
  • tangl_99
  • tangl_99
  • 2006年02月24日 22:11
  • 6671

Apriori算法--关联规则挖掘

我的数据挖掘算法代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 Apriori算法是一个经典的数据挖掘算法,Apriori的单词的意思是...
  • Androidlushangderen
  • Androidlushangderen
  • 2015年01月23日 18:33
  • 13771

机器学习(十八)——关联规则挖掘

机器学习(十八)——关联规则挖掘
  • antkillerfarm
  • antkillerfarm
  • 2017年03月08日 19:50
  • 899

weka –Apriori算法 关联规则挖掘详解

本文转自:http://blog.csdn.net/haosijia929/article/details/5596939 一、Apriori算法参数含义 本次共进行了9组实验,使...
  • linglingbaby
  • linglingbaby
  • 2012年02月28日 09:50
  • 3429

数据挖掘算法——关联规则挖掘算法

1基本概念 1.1引入:购物篮分析 假定作为超市的销售经理,你想更多地了解顾客的购物习惯,尤其是,你想知道“顾客可能会在一次购物同时购买哪些商品?”经常同时购买的商品可以摆放的近一些,以便进一步刺...
  • sshhiixx
  • sshhiixx
  • 2015年04月18日 15:51
  • 6828

推荐系统_关联规则挖掘

购物篮分析(关联规则挖掘,频繁规则挖掘) Apriori FPGrowth PTPGrowth
  • u011263983
  • u011263983
  • 2016年05月26日 10:39
  • 1918

关联规则挖掘

直接用实例来解释概念更清楚一些,加入数据库中存在10条交易记录(Transaction),具体如下表所示: 交易ID(TID) 购买商品(Items)B:bread  C:cream  M...
  • bingduanlbd
  • bingduanlbd
  • 2014年04月03日 23:03
  • 7056

关联规则应用场景实例十则

本文整理了7个天池、DataCastle、CCF中可使用关系分析算法处理的问题场景。 1 穿衣搭配推荐         穿衣搭配是服饰鞋包导购中非常重要的课题,基于搭配专家和达人生成的搭配组合数据,...
  • liulingyuan6
  • liulingyuan6
  • 2016年12月14日 13:13
  • 4522
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:CSDN在线培训:大数据环境下的关联规则挖掘
举报原因:
原因补充:

(最多只允许输入30个字)