1、关联规则的数目
对于具有d个项的数据集,可能产生的关联规则数目为:3^d-2^(d+1)+1
计算过程如下:首先考虑,对于每个项都有三种可能的选择①作为规则前件②作为规则后件③既不作为前件也不作为后件。因此,应该具有3^d个规则,但是其中存在不满足成为关联规则条件的情况------>包含以下两种情况①前件为空②后件为空,也就是说,对于每个项只有两种选择。因此,需要减去前件为空的情况2^d个,后件为空的情况2^d个,共2^(d+1)个。但是,在计算前件为空和后件为空时,存在一个情况,减去了两次空关联规则,所以需要加1。
2、关联规则的产生
我们选择满足最小支持度和最小置信度的规则作为合适的关联规则。由上述关联规则数目计算可以看出,关联规则的数目是指数级的。通过计算所有规则的置信度和支持的来找到符合条件的关联规则是不现实的。