什么是频繁样式
频繁样式(Frequent Patterns)是指在一个数据集中出现频率最高的样式(可以是一组样本集合,子列,子结构等)
Apriori算法
Apriori算法使用支持度(support)和置信度(confidence),通过剪枝来生成样式集,最终找出存在于数据集中的频繁样式。
- 支持度
样式中同时包含A和B的概率
S u p p o r t ( A ⟹ B ) = P ( A ⋃ B ) Support(A \implies B) = P(A \bigcup B) Support(