(1)L1 = find_frequent_1_itemset(D);
(2) for(k=2;Lk-1≠∮,k++){
(3) Ck = apriori-gen(Lk-1);
(4) for each t∈D {
[5) Ct = subset(Ck,t);
(6) for each c∈Ct c.count++;
(7) }
(8) Lk = {c∈Ck|c.count>min_support};
(9)}
(10)return L = ∪k Lk;
subset函数作用是产生一个Ct即项集的集合,其中的项集是事务t的子集,
而这些子集要满足是Ck中的项集,不是事务t的所有子集
一句话就是说:找出事务t中是候选的所有子集。
举个例子可能好理解
eg候选 ck={{1,2}{2,3}}
事务数据库D:
t 项集
t1 1, 2 ,3 ,6
t2 2, 3, 4
t3 1 , 3 ,5
------------------------
t=t1时
Ct={{1,2}{2,3}}
t=t2时
Ct={{2,3}}
t=t3时
Ct=空集
-----------
(2) for(k=2;Lk-1≠∮,k++){
(3) Ck = apriori-gen(Lk-1);
(4) for each t∈D {
[5) Ct = subset(Ck,t);
(6) for each c∈Ct c.count++;
(7) }
(8) Lk = {c∈Ck|c.count>min_support};
(9)}
(10)return L = ∪k Lk;
subset函数作用是产生一个Ct即项集的集合,其中的项集是事务t的子集,
而这些子集要满足是Ck中的项集,不是事务t的所有子集
一句话就是说:找出事务t中是候选的所有子集。
举个例子可能好理解
eg候选 ck={{1,2}{2,3}}
事务数据库D:
t 项集
t1 1, 2 ,3 ,6
t2 2, 3, 4
t3 1 , 3 ,5
------------------------
t=t1时
Ct={{1,2}{2,3}}
t=t2时
Ct={{2,3}}
t=t3时
Ct=空集
-----------