1 学习目标
学习时间序列数据的特征预处理方法
学习时间序列特征处理工具 Tsfresh(TimeSeries Fresh)的使用
2 内容介绍
数据预处理
特征工程
时间序列特征构造
特征筛选
使用 tsfresh 进行时间序列特征处理
3 代码示例
3.1 导入包并读取数据
import pandas as pd
import numpy as np
import tsfresh as tsf
from tsfresh import extract_features, select_features
from tsfresh. utilities. dataframe_functions import impute
data_train = pd. read_csv( "train.csv" )
data_test_A = pd. read_csv( "testA.csv" )
print ( data_train. shape)
print ( data_test_A. shape)
( 100000 , 3 )
( 20000 , 2 )
data_train. head( )
id heartbeat_signals label
0 0 0.9912297987616655 , 0.9435330436439665 , 0.764677 … 0.0
1 1 0.9714822034884503 , 0.9289687459588268 , 0.572932 … 0.0
2 2 1.0 , 0.9591487564065292 , 0.7013782792997189 , 0.23 … 2.0
3 3 0.9757952826275774 , 0.9340884687738161 , 0.659636 … 0.0
4 4 0.0 , 0.055816398940721094 , 0.26129357194994196 , 0 … 2.0
data_test_A. head( )
id heartbeat_signals
0 100000 0.9915713654170097 , 1.0 , 0.6318163407681274 , 0.13 …
1 100001 0.6075533139615096 , 0.5417083883163654