关联规则--Apriori算法部分讨论的关联模式概念都强调同时出现关系,而忽略数据中的序列信息(时间/空间):
时间序列:顾客购买产品X,很可能在一段时间内购买产品Y;
空间序列:在某个点发现了现象A,很可能在下一个点发现现象Y。
例:6个月以前购买奔腾PC的客户很可能在一个月内订购新的CPU芯片。
注:1)序列模型=关联规则+时间/空间维度
2)这里讨论的序列模式挖掘指的是时间维度上的挖掘。
一、基本定义
序列:将与对象A有关的所有事件按时间戳增序排列,就得到对象A的一个序列s。
元素(事务):序列是事务的有序列表,可记作
,其中每个
是一个或多个事件(项)的集族,即
。
序列的长度:序列中元素的个数。
序列的大小:序列中事件的个数,K-序列是包含k个事件的序列。
如:如下课程序列中包含4个元素,8个事件。
子序列:序列t是另一个序列s的子序列,若t中每个有序元素都是s中一个有序元素的子集。即,序列
是序列