Python关联规则Apriori算法
介绍
Apriori算法是一个常用的关联规则挖掘算法,用于挖掘商品之间的关联关系。该算法的基本思想是先通过扫描数据集,找到满足最小支持度的所有项集,再通过计算置信度,从而得到满足最小置信度的强关联规则。
算法步骤
Apriori算法的流程可以总结为下面3步:
- 找到所有频繁项集。
- 根据频繁项集,找到强关联规则。
- 根据置信度,剔除不符合要求的规则。
代码实现
使用Python实现Apriori算法非常简单,可以使用Python中的mlxtend
库来完成,具体实现代码如下:
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori
dataset = [[