本节的主要内容是对心跳信号时间序列数据的做特征工程,用到的时间序列特征处理工具是— Tsfresh(TimeSeries Fresh)。tsfresh是专门用于从时间序列中提取特征的工具(安装------pip install tsfresh)。这个工具包含很多计算函数,可以从多个维度对时间序列做处理。
例如:(索引自:原文链接:https://blog.csdn.net/yunini2/article/details/92805230)
tsfresh.feature_extraction.feature_calculators.abs_energy(x)
时间序列的平方和
tsfresh.feature_extraction.feature_calculators.absolute_sum_of_changes(x)
返回序列x的连续变化的绝对值之和
tsfresh.feature_extraction.feature_calculators.agg_autocorrelation(x, param)
计算聚合函数f_agg(例如方差或者均值)处理后的自相关性,在一定程度可以衡量数据的周期性质,l表示滞后值,如果某个l计算出的值比较大,表示改时序数据具有l周期性质。n是时间序列的长度, 是方差,μ表示均值
tsfresh.feature_extraction.feature_calculators.agg_linear_trend(x, param)
对时序分块聚合后(max, min, mean, meidan),然后聚合后的值做线性回归,算出 pvalue(),rvalue(相关系数), intercept(截距), slope(斜率), stderr(拟合的标准差)
tsfresh.feature_extraction.feature_calculators.approximate_entropy(x, m, r)
近似熵,用来衡量一个时间序列的周期性、不可预测性和波动性
tsfresh.feature_extraction.feature_calculators.ar_coefficient(x, param)
自回归模型系数,适用于极大似然估计的AR(k)模型,参数k是滞后项
tsfresh.feature_extraction.feature_calculators.augmented_dickey_fuller(x, param)
扩张的Dickey-Fuller检验(ADF)是在时间序列分析中用来辨识个别变数的样本资料是否存在单位根,返回的是测试统计量的值
tsfresh.feature_extraction.feature_calculators.autocorrelation(x, lag)