1. 前言
有点泄气,读者不多,赞同也不多,不过万事开头难。上一篇我分享了因子库的设计,这一篇主要讲实现,加上我的标题叫Python与量化多因子,势必要加点代码在里头,不过旨在抛砖引玉,点到即止,更多的内容需要读者们自己去探索。
对了,读者如果自己动手,基础的Pandas,Numpy的操作还是需要会的,网上也有很多教程,大家也可以去看,如果有需要,后面我也可以写篇文章来介绍。
2. 因子构成
好像现在各家券商的研报后面都会加上他们因子的构成,很多因子也都是差不多的。我把要做的因子简单的归类,大概有如下这些:规模类
估值类
盈利类
成长类
技术类
一致预期类
另类
其实大家用的因子估计都差不多,现在更关键的是对风格的把握,但这显然也更难。
3. 准备工具
上一篇文章,我有说,我们的因子来自于一些底层的数据,但这些数据都存储在一些底层的表当中,我们需要一个中间层,构建一个统一的数据接口,为我们计算因子提供便利。
这个中间层至少需要包含:提供交易日历
提供股票的行情
提供财务数据,一致预期数据
提供行业分类数据
这四个功能,至于每个功能如何实现,具体问题具体对待。
参考网上开源的Tushare,我们也可以设计自己简单的Python数据接口:
import pandas as pd