机器学习算法(九):Apriori算法
Apriori算法是一种关联分析方法,用于发现隐藏在大型数据集中有意义的联系。所发现的联系可以使用关联规则和频繁项集来表示。
一些基本概念
项集
令 I={ i1,i2,…,id} 是购物篮数据所有项的集合,而 T={ t1,t2,…,tN} 是所有事务的集合。每个事务 ti 包含的项集都是I的子集。在关联分析中,包含0个或多个项的集合被称为项集。如果一个项集包含k个项,则称它为k-项集。空集是指不包含任何项的项集。
项集的一个重要性质是它的支持度计数,即包含特定项集的事务个数。项集X的支持度计数 σ(X)