一:论文位于:
https://www.researchgate.net/publication/221654035_FreeSpan_Frequent_pattern-projected_sequential_pattern_mining
标题:FreeSpan: Frequent pattern projected sequential pattern mining
基于频繁模式投影的序列模式挖掘
二:FreeSpan算法
基于频繁模式投影的序列模式挖掘算法,该算法主要利用投影,每次选出长度为2的频繁序列,再递归的对其产生的投影进行挖掘,最终挖掘出所有的序列模式。
算法流程:
(1)生成频繁项
给定序列数据库S,以及最小支持度sup。第一扫描S找到其中所有的频繁1项,按照降序排列。
比如如下的S,可以生成频繁1项集〈b:5,c:4,a:3,d:3,e:3,f:3〉
(2) 生成频繁矩阵
扫描S,构建频繁项矩阵,是一个三角矩阵
F[x,y]F[x,y]F[x,y](其中x, y为频繁项)由一个三元组(