未经授权,严禁转载
引言
>>> 研究目的
传统的因子指标挖掘主要集中于财务报表、个股中低频率的价量等相关的数据维度,而这部分数据维度的增量价值的挖掘已逐渐饱和,需从其他新的数据维度中挖掘新的因子指标,本篇研究内容参考海通证券研报《高频量价因子在股票与期货中的表现》,本篇报告从个股日内高频数据出发,将目光聚焦于日内价量信息和交易特征,使用分钟数据构建一系列高频因子,实证各因子在股票市场中的表现(本研究主要探讨股票部分,原研报期货部分未做研究)。
>>> 研究框架
高频因子可以分为收益率分布、成交量分布、量价复合、资金流和日内动量等几个主要的类别,各类因子还可以做进一步的细化,例如收益率分布因子包括已实现偏度、已实现峰度和上下行波动率等。按照这个思路,展开研究:
1)因子数据获取:
-
从设置股票池,获取指定时间范围的分钟数据,按照研报思路,获取每分钟的数据,进行因子值计算函数构造,按日期将因子值存入字典
2)因子数据处理:
-
将计算出来的因子值按日期遍历获取,根据需要进行数据处理
-
在T期因子值中加入T+1期收益值,方便因子分析统计
3)因子统计分析:
-
针对每期截面进行因子IC统计
-
汇总为时间序列上的IC数据,进行展示
4)分组回测分析:
-
根据所选的因子,在每个调仓日进行股票排序,分层进行收益净值观察
-
根据所选因子,在每个调仓日进行股票排序,进行多头组合收益分析
>>> 参数设置
1)时间范围:
-
2014.6 ~ 2019.6
2)研究指数:
-
上证50、沪深300、中证500
3)股票池:
-
上证50、沪深300、中证500指数成分股以及全部A股
-
剔除 ST、停牌、涨跌停、上市不满 6 个月
-
月初调仓
4)费用设置:
-
暂无交易成本设置
>>> 研究内容及结论
1)收益率分布因子。
-
高频偏度因子与高频峰度因子具有一定的选股效果,统计期高频偏度因子 IC均值达到0.034 与0.0198,负值占比为 69.5% 与 71.2%,多空组合年化收益差分别为 14.45% 和 15%,最优分组年化收益为 18.02% 和 20.9%,且因子在股票中呈现出反转效应,即高频偏度与峰度小的股票未来收益表现更好,下行波动占比因子未有良好表现(最优分组默认头尾分组)。
2)成交量分布因子。
-
日内不同时段的成交量分布能够反映投资者的行为特征。上午10 点-11 点成交量占比因子和股票下月收益显著正相关,而收盘前半小时成交量占比因子和股票下月收益显著负相关,IC均值达到0.040 与0.0565,负值占比为 35.6% 与 72.9%,二者分层效果明显,多空组合年化收益差均可以到达 17%左右&#