[数据挖掘]关联规则挖掘

       关联规则(association rule)是数据中所蕴含的一类重要规律。关联规则挖掘的目标是在数据项目中找出所有的并发关系(cooccurrence relationships),这种关系也称为关联(association)。关联规则挖掘的经典应用是购物篮(Market Basket), 关联规则挖掘并没有考虑客户购买商品时的顺序。

      在介绍关联规则挖掘算法前,我们先了解一些相关的概念。

  关联规则的基本概念

      关联规则挖掘问题通常可以表述为:I={i1, i2, …, im}是一个项目(Item)集合,T={t1,t2, …, tn} 是一个事务(Transaction)集合,其中每个事务ti是一个项目集合, 并且满足ti属于I。

      一个关联规则是一个如下形式蕴含的关系X—> Y, 其中X是I的真子集,Y也是I的真子集,并且X∩Y=Ф, X 或 Y是一个项目的集合, 称作项集(ItemSet),并且X为前件,Y为后件。

      如果项集X是事务T的子集,X在T中的支持计数(表示为X.count)是T中包含X的事务数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据挖掘关联规则挖掘是一种常见的数据挖掘技术,用于发现数据集中的频繁项集和关联规则。频繁项集是指在数据集中经常出现在一起的一组项,而关联规则是指两个或多个项之间的关系。关联规则通常采用“如果...那么...”的形式表示,例如“如果顾客购买了牛奶和面包,那么他们也可能购买黄油”。 常见的关联规则挖掘算法包括Apriori、FP-growth、Eclat和ORAR等。Apriori算法是一种基于频繁项集的挖掘算法,它通过迭代的方式生成候选项集,并使用剪枝技术来减少候选项集的数量。FP-growth算法是一种基于树结构的挖掘算法,它通过构建一棵FP树来发现频繁项集。Eclat算法是一种基于垂直数据格式的挖掘算法,它通过交换和合并项集来发现频繁项集。ORAR算法是一种基于关联规则的挖掘算法,它通过对关联规则进行排序和过滤来发现有用的规则。 对于给定的数据集,关联规则挖掘算法通常包括以下步骤: 1. 数据预处理:包括数据清洗、数据变换和数据规约等步骤。 2. 频繁项集挖掘:使用Apriori、FP-growth、Eclat等算法来发现频繁项集。 3. 关联规则生成:对于每个频繁项集,生成所有可能的关联规则。 4. 关联规则评估:使用支持度、置信度、提升度等指标来评估关联规则的质量。 5. 关联规则筛选:根据指定的阈值来筛选出有用的关联规则。 <<请问关联规则挖掘有哪些应用场景?>> <<关联规则挖掘算法有哪些优缺点?>> <<如何评估关联规则的质量?>>

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值