Apriori 算法学习

本文介绍了数据挖掘中的Apriori算法,详细阐述了其基础概念、逐层搜索的迭代方法以及连接和剪枝步骤。通过具体例子和伪代码展示了Apriori算法的工作流程,帮助读者深入理解该算法的原理及其在关联分析中的应用。
摘要由CSDN通过智能技术生成

  近来小看关联分析的Apriori算法,参考《数据挖掘:概念与技术3rd》,作此篇。

1. 基础概念

-支持度(Support):support( A => B ) = P(A U B)
-置信度(Confidence): confidence(A => B ) = P( B | A )
-项集(itemset) : 包含K个项的项集成为K项集
-频繁项集(frequent itemset) : 如果项集 I 满足最小支持度阈值, 则 I 是频繁项集

2. 算法简介

2.1 简介

  Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。
  首先,通过扫描事务记录,找出所有的频繁1项集,记做L1,利用L1找频繁2项集L2,使用L2找L3,如此下去,直到不能再找到任何频繁k项集。
  为了提高频繁项集逐层产生的效率,一种称为先验性质(Apriori property)的重要性质用于压缩搜索空间.
  先验性质:频繁项集的所有非空子集也一定是频繁的.

2.2 流程

  考察使用Lk-1找出Lk,主要有连接步剪枝步:
  (1)连接步: 为了找出Lk, 通过将Lk-1与自身连接产生候选K项集的集合, 记为Ck. 记li[j]表示li

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值