Similarity Match Over High Speed Time-Series Streams
应用,如金融数据分析、天气数据预测和多媒体数据检索。它最初的任务是寻找那些类似于模式(查询)时间序列数据的时间序列,其中模式和数据时间序列都是静态的。近年来,随着人们对流数据管理需求的不断增长,基于相似性的流时间序列检索因其在流数据处理中的独特要求,如一遍搜索、快速响应等,引起了新的研究热点。本文研究了高速流数据上的模式匹配问题。我们将提出一种新的时间序列表示方法,称为多尺度段均值(multi-scaled segment mean, MSM),用于流时间序列数据,它可以增量计算,因此可以完美地适应流的特性。提出了一种新的多尺度表示上的多步过滤机制。分析表明,该机制可以大大减少搜索空间,从而提供快速响应。大量的实验表明,与多尺度小波相比,多尺度表示结合多步滤波方案能够有效地过滤虚假候选和检测模式。