负关联规则实例如下:
很多的算法都使用“支持度-可信度”的框架。这样的结构有时会产生一些错误的结果。看如下表的一个例子。支持度与可信度的:
%
买咖啡 不买咖啡 合计
买牛奶
20 5 25
不买牛奶
70 5 75
合计
90 l0 l00
由表可以了解到,如果设定最小支持度和最小可信度分别为
0.2和0、6,按照Agrawal的定义得到关联规则“买牛奶= 买咖啡
(s=0.2,c=0.8)” ,即80%的人买了牛奶就会买咖啡。但同时也可以得到“90%的人肯定会买咖啡”。换句话说,买牛奶这个事件对于买咖啡这个事件的刺激作用(80%)并没有想象中的
(90%)那么大。反而是规则“买咖啡->不买牛奶
(s=0.7,c=0.78)” 更具有实际的指导意义。