apriori包的使用_数据挖掘十大算法—— Apriori

Apriori算法是一种用于关联规则挖掘的算法,通过频繁项集来发现数据间的关联。它利用支持度和置信度衡量频繁项集和关联规则。尽管算法简单易懂,但其主要缺点是候选集生成时组合过多且需要多次全数据扫描,导致高I/O负载。在实际应用中,AprioriTid等改进算法能有效优化数据处理。本文将介绍Apriori的基本概念、优缺点,并通过实例展示其在R语言中的应用。
摘要由CSDN通过智能技术生成

十大算法 —— Apriori

1、基本介绍

(1)概述:Apriori算法是一种通过频繁项集来挖掘关联规则的算法。该算法既可以发现频繁项集,又可以挖掘物品之间关联规则。分别采用支持度和置信度来量化频繁项集和关联规则。其核心思想是通过候选集生成和情节的向下封闭检验检测两个阶段来挖掘频繁项集。

其最常见的改进算法为AprioriTid算法,该改进算法与原算法的主要区别在于对数据集的更新方式不一样。当数据量较大时,使用改进算法得到的新数据集会比原始数据集小很多,这样在进行遍历的时候就节省了很多时间。

(2)优点

[1] 该算法的关联规则关联规则是在频繁项集基础上产生的,这可以保证这些规则的支持度达到指定的水平,具有普遍性和令人信服的水平;

[2] 算法简单,易于理解,对数据的要求低。

(3)缺点

[1] 在每一步产生候选项目集的时候循环产生的组合过多,没有排除不应参与组合的项;

[2] 每次计算项集的支持度的时候,都对数据库中的全部数据进行了一遍扫描比较,I/O负载很大。

2、算法流程

(1)问题说明

e69971c2668568e0dc4320f7d57b4c28.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值