时间序列数据是一个物体或多个物体随着时间不断产生的数值序列。比如:从智能电表中获得月电度使用量;每日股票的价格和交易量;ECG(心电图);地震仪,网络性能数据等等。时间序列数据一定基于时间顺序,这个顺序是所有时间分析算法的基础。IBM Streams时间序列工具包(TimeSeries Toolkit),可以用来预处理、分析和建模时间序列数据。
在IBM Streams里,时间序列数据有三种主要类型的处理方法:
- 数据预处理:包括读取、修复、条件化数据。
- 数据分析:包括分析时间序列数据的内在信息。比如:对时间序列数进行计算统计信息和关联,解析和转换.
- 数据建模:包括时间序列模型的创建以及使用模型来预测或回归。
这个工具包还提供一系列函数来自动生成以测试和验证为用途的时间序列数。以下对该工具包的具体功能:
1. 分析模块具有以下Operator(对时间序列数据流进行连续运算)
- AnomalyDetector异常检测
- CrossCorrelate2交叉关联(滑动点乘或滑动内乘),用于测量两个时间序列的相似度
- CrossCorrelateMulti用于模式识别