TsFresh(TimeSeries Fresh)是一个Python第三方工具包。它可以方便地对时间序列数据进行处理,获得大量的特征。这些特征可以用以训练分类器,以高效地实现对时间序列数据的分类、识别等。然而,在工程实现时,更多地是采用Java等语言,这需要利用Java实现对TsFresh的特征进行直接计算,故需要对TsFresh的某些特征进行深入地分析,并在Java语言下实现。
特征cwt_coefficients简介
命令格式:cwt_coefficients(x, param)
计算基于Ricker小波(墨西哥草帽)
的连续小波变换,并根据参数字典param中的w与coeff选择出相应的行与列的特征值。
参数:
- x:时间序列,数据类型:numpy.ndarray
- param:参数字典:{"widths": o, "coeff": p, "w": q},其中,o为整数数组,表示小波变换时先用的宽度值,q为整数,表示输出系数所反映的宽度,p为整数,为特定小波宽度下的系数索引值
特征cwt_coefficients计算原理
- 根据宽度参数的10倍及时间序列长度的最小值设置Richer小波的长度,并产生具有该长度的呈中心对称的Richer小波序列
- 将时间序列x与Richer小波序列进行线性卷积,并删除前后各一半的小波序列长度,使得输出的卷积数据长度与输入序列长度一致
- 根据宽度参数w及参数Coeff,选择小波序列中的相应数据作为特征输出
Java实现
本特征在实现过程中,有几个问题需要注意:
1. 生成Richer小波时,需要注意小波的中心在序列的中心
2. 小波变换中所涉及的卷积运算是采用相关运算来替代的,卷积运算
而相关运算
显然,在两个公式中,第二个序列v的排序是相反的,因此,采用相关运算处理卷积时,首先需要将序列v进行反序。反序的操作为:
public static double[] reverse(double[] a) {
double[] b=a;
for(int start=0,end=b.length-1;start<end;start++,end--) {
double temp=b[start];
b[start]=b[end];
b[end]=temp;
}
return b;
}
3. 生成的小波变换后的数据序列,将选择索引值为Coeff的数据作为特征输出