1.实验背景
最近毕业设计中,希望通过wifi数据计算人员轨迹的相似度。
人员轨迹数据按照时间顺序,以地点id的序列来表示。示例:
a = [180, 180, 141, 146, 141, 200, 235, 235, 173, 141, 141, 172, 180]
b = [165, 235, 180, 141, 240, 171, 173, 172]
LCSS算法则可以计算出两个序列之间的最长公共子序列。
值得一提的是,子序列是有序的,但不一定是连续,作用对象是序列。
例如:序列 X = 是序列 Y = 的子序列,对应的下标序列为 <2, 3, 5, 7>。
2.LCSS算法介绍
下面我们看一下,如何使用动态规划的思想来解决最大公共子序列问题。
首先考虑最大公共子序列问题是否满足动态规划问题的两个基本特性:
1. 最优子结构:
设输入序列是X [0 .. m-1] 和 Y [0 .. n-1],长度分别为 m 和 n。和设序列 L(X [0 .. m-1],Y[0 .. n-1]) 是这两个序列的 LCS 的长度,以下为 L(X [0 .. M-1],Y [0 .. N-1]) 的递归定义:
1)如果两个序列的最后一个元素匹配(即X [M-1] == Y [N-1])
则:L(X [0 .. M-1],Y [0 .. N-1])= 1 + L(X [0 .. M-2],Y [0 .. N-1])
2)如果两个序列的最后字符不匹配(即X [M-1] != Y [N-