5.7一个数据库有5个事务,如下表所示。设min_sup=60%,min_conf=80%。
(1)分别用Apriori算法和FP-growth算法找出所有频繁项集,比较两种挖掘方法的效率。
(2)比较穷举法和Apriori算法生成的候选项集的数量。
(3)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。
解(1)由5*60%=3得:
(2)
(3)
5.7一个数据库有5个事务,如下表所示。设min_sup=60%,min_conf=80%。
(1)分别用Apriori算法和FP-growth算法找出所有频繁项集,比较两种挖掘方法的效率。
(2)比较穷举法和Apriori算法生成的候选项集的数量。
(3)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。
解(1)由5*60%=3得:
(2)
(3)