数据挖掘之关联规则挖掘(Apriori算法)

本文详细介绍了数据挖掘中的关联规则挖掘,重点解析Apriori算法,包括关联规则的基本概念、Apriori算法原理及其实例。通过对事务数据库的多次扫描,发现频繁项集并生成强关联规则。
摘要由CSDN通过智能技术生成

一、概述

本篇博文主要阐述数据挖掘相关的关联规则挖掘的算法(Apriori算法)。主要介绍关联规则的基本概念、Apriori算法原理和Apriori算法实例,文章末尾处附加Apriori算法源程序。

二、关联规则挖掘的基本概念

关联规则挖掘发现大量数据中项集之间有趣的关联关系。如果两项或者多项属性之间存在关联,那么其中一项的属性可以依靠其他属性值进行预测。

关联规则挖掘问题可以分为两个子问题:1、找出事物数据库中所有大于等于用户指定的最小支持度的数据项集;2、利用频繁项集生成所欲需要的关联规则,根据用户设置的最小置信度进行取舍,最后得到强关联规则。

2.1、项与项集

数据库中不可分割的最小单位信息称为项,用符号i表示。项的集合称为项集,用 I 表示。项集的个数为k称为k-项集。比如,集合{啤酒、尿布、奶粉}称为3-项集。

2.2、事物

事物数据库T={t1,t2,t3,....,tn}是由一系列具有唯一标识的事务组成的。每个事务ti(i=1,2,3,4,5....,n)包含的项集都是I的子集。

2.3、项集的频数(支持度计数)

包括项集的事务个数称之为项集的频数(支持度计数)

2.4、关联规则

关联规则x==>y 的蕴含式。其中x,y都是I的真子集,并且x∩y=∅。x称之为前提,y称之为结果。关联规则反应x中的项目出现时,y中项目也跟着出现的规律。

2.5、关联规则的支持度(support)

关联规则的支持度是交易集中同时包含x和y的交易数和所有交易数之比。它反应了x和y中所包含的项在事务集中同时出现的概率,support(x==》y&

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI研究员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值