要做的事情
1 计算出D的四个因子的参数平原
云开雾散 atr 潮汐因子 coppock分钟数据计算完了
hurst分钟数据计算完了,还没有在回测框架写
勇攀高峰之前好像写错了,要重算
先写因子,然后处理脚本1和脚本8
适度那个截面怎么算
2 计算出H的所有参数平原
3 为什么因子的计算周期和持仓周期是一样的???
4 脚本1和脚本2,到底哪个计算了因子
计算出的高频数据是如何转化为参数平原的
- 脚本1:数据整理
- 脚本5:参数平原计算
- jupyter代码:只画图,没计算
数据整理的逻辑
- 对于合约和现货,获取所有币的分钟数据的csv文件,以及文件类型,合约/现货
- 整理成一个list,这里的文件都是小时级别的
- 因子数据是天级别的
- 对于所有的分钟数据,调用calc_factors方法
calc_factors方法
- 传入的参数是每个币种的合约或者现货的成交数据
- 首先和benchmark合并,这里的benchmark是2017年到现在的小时级别数据
- 由两个resample:一个是因子计算的resample,另一个是选币周期的resample
- 为什么data_dict为空,这里没有选股周期吗?这里的选股周期是param吗?好像不是
参数平原怎么计算的
两个pkl文件分别存储什么
periods 的pkl文件:存储的是日线数据,没有计算因子
factors的pkl文件:存储的是某一币种,某一因子在所有参属下的值
这两个文件是在什么时候计算的:calc_save_factors_for_filename,
calc_save_factors_for_filename这个函数里面:
对于某个因子,对于所有的参数,分别计算相应的因子。