首先了解一下 A->(EFG)->C 是个什么形式:
这里面被括号包覆的部分表示EFG是无序存在的,比如EFG,EGF,GEF,GFE他们都可以统一写成(EFG)的形式,假设这四个项集都只在A~C的时间段内出现了一次,但是一旦把他们看成(EFG)的形式,那么他们就相当于出现了四次,如果min_sup<=4的话那(EFG)就可以被认为是频繁的。
这种挖掘模式的意义:
导师没有跟我说明这种挖掘模式的意义何在,我大概想了一下可能是这种情况:两位老师A、C发言之间有EFG三位学生在短时间内在多个时间点进行过频繁交流,但是他们说话的次序是乱序的。通过本模式就可以找出这三位同学很可能是技术伙伴或者是合伙人等等,但是依靠传统的模式他们的交流很可能就不是频繁的,也就找不出他们的关系了。
当然这种形式也未必非得是在某两个事件A,C之间进行的,这并不重要,如何挖掘(EFG)模式才是关键。
解决思路: