关联规则apriori算法_sklearn(九)apriori 关联规则算法,以及FP-growth 算法

4ecccdd25aea766371806f5130acb5dd.png

是什么:

apriori算法是第一个关联规则挖掘算法,利用逐层搜索的迭代方法找出数据库中的项集(项的集合)的关系,以形成规则,其过程由连接(类矩阵运算)与剪枝(去掉没必要的中间结果)组成。是一种挖掘关联规则的频繁项集算法,一种最有影响的挖掘布尔关联规则频繁项集的算法。核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。

关联规则挖掘,在最早提出时,是为了发现交易数据库中不同商品之间的联系规则。刻画顾客购买行为模型,指导商家科学地进行进货,库存以及货架设计等。

改进的算法有:并行关联规则挖掘Parallel Association Rule Mining,以及数量关联规则挖掘Quantitive Association Rule Mining。提高挖掘规则算法的效率,适应性,可用性以及应用推荐。

频繁项集的评估标准:支持度,置信度,提升度三个方面。

应用领域:在商业,网络安全广泛使用。通过对数据的关联性进行了分析和挖掘,挖掘出的这些信息在决策制定过程中具有重要的参考价值。

在消费市场价格分析中,能够很快求出各种产品之间的价格关系和它们之间的影响,可以瞄准目标客户,采用个人股票行市,最新细心,特殊的市场推广活动或其他的一些特殊信息手段&#x

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我可以为您提供一个基于Apriori算法FP-Growth算法关联规则挖掘实例。 假设我们有一个超市的销售数据,其中包含了不同商品的交易记录。我们希望挖掘出哪些商品之间存在着关联关系,以便超市可以根据这些关联关系制定更加有效的促销策略。 首先,我们使用Apriori算法进行关联规则挖掘。Apriori算法是一种基于频繁项集的挖掘方法,通过寻找频繁项集并生成关联规则来发现不同商品之间的关联关系。 我们可以使用如下的伪代码实现Apriori算法: ``` 1. 扫描数据集,统计每个项的支持度 2. 根据最小支持度过滤掉支持度小于该值的项 3. 对剩余的项进行两两组合,得到候选项集 4. 扫描数据集,统计候选项集的支持度 5. 根据最小支持度过滤掉支持度小于该值的候选项集 6. 对剩余的候选项集进行两两组合,得到新的候选项集 7. 重复步骤4-6,直到不能再生成新的候选项集 8. 根据生成的频繁项集,生成关联规则,并计算其支持度和置信度 9. 根据最小置信度过滤掉置信度小于该值的关联规则 ``` 接下来,我们使用FP-Growth算法进行关联规则挖掘。FP-Growth算法是一种基于树结构的挖掘方法,通过构建频繁模式树来发现不同商品之间的关联关系。 我们可以使用如下的伪代码实现FP-Growth算法: ``` 1. 扫描数据集,统计每个项的支持度 2. 根据最小支持度过滤掉支持度小于该值的项 3. 根据剩余项的支持度构建FP树 4. 对每个项的条件模式基进行递归,得到条件模式树,并对其进行剪枝和合并 5. 对每个项的条件模式基进行递归,得到频繁项集 6. 根据生成的频繁项集,生成关联规则,并计算其支持度和置信度 7. 根据最小置信度过滤掉置信度小于该值的关联规则 ``` 通过上述算法,我们可以得到不同商品之间的关联规则,并根据其支持度和置信度进行筛选和排序,以便超市可以根据这些关联关系制定更加有效的促销策略。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值