tsfresh今天认真看了一遍,就是一个talib集成包(升级版)。
获得基础因子数据,然后放入写好的所有的函数中,计算新的因子,注意,他只能单个因子,如果用两个参数的函数,无效。相信大家都明白意思了吧。
因子生成的原理是,tsfresh预置了783个算子(calculator),会逐个用在每一个交易日的基础因子数值序列上,这就相当于孙悟空拔一根猴毛下来,
能变出783个形态各异的化身,相同计算公式不同单参数也算1个,11乘以783就是8613,具体的算子计算公式请见官方文档:
https://tsfresh.readthedocs.io/en/latest/text/list_of_features.html
举例,talib中有一个atr函数,用到了OHLC四个价格,tsfresh是计算不了,因为他只能使用一个因子。
现在正式进入学习环节:
导包:
import datetime
start_time = datetime.datetime.now() #开始时间
# 核心代码部分
from tsfresh import extract_features
from tsfresh.utilities.dataframe_functions import roll_t