使用tsfresh工具对时序数据进行特征提取

当我们在对时序数据进行特征提取时,常常用到的方法包括滑动平均,指数平滑等等,tsfresh可以为我们提供几十至几百个统计特征,包括时序信号的能量等等,只需要一次操作即可。

以下内容来自tsfresh的文档,先通过一个实例来认识一下这个快速有效的工具:

1. 首先加载数据


2. 看一下数据的形式

特征向量:


标签:


该数据集中每个id包含15个时间点的数据,也就是说,F_x~T_z 这6列,对于每个id都有15个数据点。

接下来并没有多余的操作,直接调用该模块中的方法进行特征抽取:

1. 抽取特征


       可以看出,调用extract_features()方法之后,返回的仍是一个dataframe,列数由原来只有几列增加到几千列。

返回的结果中,每一行表示对一个对象抽取特征后的结果,为了方便理解,我们以id=1作为说明。原来id=1的对象在F_x特征上有15个时序数据,我们将这15个数据平方求和,得到的一个值做为id=1这个对象的第一个新特征,即F_x_abs_energy;再对这15个时序数据做其他操作,比如求均值、方差等等,得到的结果依次往后排开,直到计算完最后一列T_z的特征后,属于id=1这个对象的特征向量也就生成了。id=2、id=3...同理。

2. 特征过滤

由上一步操作得到的特征中存在空值(NaN),这些没有意义的值需要去掉,选择有用的特征进行保留。从结果可以看出,数据的维度减少了很多。



3. 特征抽取与过滤同时进行(一步到位,省去多余计算)



可以看出结果与分两步进行的结果是一致的。


以上就是tsfresh的简单应用,下次补上输入数据形式以及参数的含义。

  • 9
    点赞
  • 62
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值