介绍
先验(Apriori)算法是挖掘关联式规则(Association Rules)的经典算法之一。
它的作用就是用来寻找数据当中的强关联式规则(Strong Association Rules)。
强关联式规则是满足最低支持度(minimum support)和最低置信度(minimum confidence)的规则。
规则:
X→Y;X和Y都属于I,且X和Y的交集为空。
支持度(support):
support(X → Y) = P(X U Y)
置信度(confidence):
confidence(X → Y) = P(Y | X)
算法
Step1:
遍历数据库,并且得出不同项(Item)的频数。
这个表被记为C1。