关联规则挖掘实验——实验内容及重要知识点:实现先验算法、计算支持度、置信度 并进行关联规则挖掘

本文详细介绍了关联规则挖掘的实验内容,包括Apriori算法的实现、频繁项集的生成、支持度和置信度的计算。通过实例展示了如何利用Apriori算法减少候选项集,挖掘出强关联规则,从而理解关联规则挖掘的过程。
摘要由CSDN通过智能技术生成

1.实验主要内容

主要:

  • 实现先验算法(Apriori算法)
  • 打印出来(每一步的)频繁项集
  • 计算支持度 置信度(自写代码来实现)

找出符合最小支持度的频繁项集&符合最小置信度的强关联的关系

2.重要概念

关联规则挖掘

关联规则的目的:

在事务、关系数据库中的项集和对象中发现频繁模式、关联规则、相关性或者因果结构

频繁模式:数据库中频繁出现的项集

关联规则挖掘过程:

给定事务的集合 T, 关联规则发现是指找出支持度大于等于 min_sup并且置信度大于等于min_conf的所有规则。
min_sup 对应的支持度阈值
min_conf 对应的置信度阈值

关联规则的形式

关联规则是形如在这里插入图片描述的蕴含表达式
其中 X 和 Y 是不相交的项集
在这里插入图片描述

在这里插入图片描述

支持度

在这里插入图片描述
在这里插入图片描述

置信度

在这里插入图片描述
在这里插入图片描述

频繁项集

满足最小支持度阈值(min_sup)的所有项集
在这里插入图片描述<

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值