Association Rule
关联规则:项目集之间的蕴含表达式,形如X -> Y,其中X,Y是不相交项集。
关联规则的强度可以用它的支持度和置信度来度量
项目集Itemset: 一系列的items,对项集X的支持度计数表示为,
支持度Support: 事务中包含项目集的频率
**置信度Confidence:**衡量在事务中的Y项目集中X出现的频率
Association rule mining task: 给定一系列事务,发现支持度大于最小支持度阈值,置信度大于最小置信度阈值的关联规则。
Apriori principle: 如果项目集频繁,那么他的所有子集也一定频繁
关联规则解法分为两步:
第一步:生成频繁项目集(支持度比阈值大的)
第二部:生成规则:从频繁项目集中生成高置信度的规则