Datawhale 零基础入门数据挖掘Task3特征工程学习笔记打卡
前言
学习时间序列数据的特征预处理方法以及时间序列特征处理工具 Tsfresh(TimeSeries Fresh)的使用
一、导入库和数据
1.导入库
import pandas as pd
import numpy as np
import tsfresh as tsf
from tsfresh import extract_features, select_features
from tsfresh.utilities.dataframe_functions import impute
注:缺少tsfresh库,用!pip install tsfresh
下载,下载完成后重启colab,重新导入库
2.数据读取及预览
使用Google Colab上的notebook,从drive里导入数据,具体方法见心跳信号分类预测Task1赛题理解
#google drive mount
from google.colab import drive
drive.mount('/content/drive')