文章目录
写在前面:《计算机应用研究》;
作者:吴学雁、黄道平(华南理工大学)
1 摘要
- 研究的是:时间序列子序列匹配问题
- 首先识别出序列中的极值点,然后根据极值点 使用多层次极值划分法对长序列进行划分。
- 然后对划分得到的多层次子序列集 使用改进的动态时间弯曲方法与查询序列进行相似性匹配。
- 最后找到与查询序列最相似的子序列。
2 引言
-
时间序列存在各种复杂变形(如平移、伸缩、间断等),且变形时间和变形程度均无法预料,而广泛采用欧式距离及其变体 对时间轴的变形非常敏感,一些轻微的改变就会导致欧式距离发生很大变化。
-
在时间序列数据中,尤其是水文时间序列,最值得关注的往往是序列中的一些特征点。
-
本文提出一种提取重要极值点的方法,依据重要极值点对时间序列进行分段表示;然后在此基础上使用一种改进的DTW方法进行相似性度量。
3 研究现状
3.1 全序列匹配和子序列匹配
时间序列相似性查询分为全序列匹配和子序列匹配两种方式。在全序列匹配中,查询序列与被查询序列的长度相同;在子序列匹配中,查询序列Q和查询序列P 被给定,任务是在序列P中寻找与序列Q相匹配的子序列。
3.2 三种子序列匹配分段方式
3.3 相似性度量函数的选取
- 欧式距离对于时间轴的变化非常敏感
- 大量文献都是在DTW的基础上进行改进,并且大部分改进都是在使用DTW算法之间,加入预先的筛选剪枝过程。
4 本文重点——多层级极值划分方法
4.1 重要性标志算法(EIIR)
- cyc是用户定义的参数,表示极值的计算邻域范围。如果
cyc=3
,则表示在序列点前后三个点的范围内进行计算。 - 在
cyc
范围内判断重要极值点。