基于日内交易特征的因子选股策略

摘要:

个股的日内交易特征是当日交易关键要素的概况。通过多维度刻画一段时间内高开低收以外的日内交易细节信息,使得低频交易成为可能。

利用个股分钟级别的量价数据构造月频因子,我们更为推荐两步算法:首先刻画个股日内交易特征,再统计当月的日内交易特征。其更能突出体现个股日内交易细节信息,且与传统因子相关性较低。

日内交易特征可分为交易情绪、参与者结构和博弈状态三大类。我们分别对三大类因子特征进行举例说明,并对各因子进行有效性检验。多空有效的因子包括:日内BETA、最高级出现时间、收盘成交量占比、成交量变异数比率、量价非平稳时间序列相关性等。月度IC绝对值在3%-4%之间。

在组合构建端我们建议根据因子的多空表现分为两类:负面排除因子和多头增强因子。日内交易特征因子绝大多数仍然是空头有效,可作为负面排除因子,仅收盘成交量占比因子多空表现均较为稳定,建议作为多头增强因子。

仅使用日内交易特征因子构建的指数增强策略,经过基本面初筛、技术面复筛和ALPHA因子增强三步后,年化超额收益18.53%,最大回撤8.14%,信息比率2.15。

1. 引言

个股的日内交易特征是当日交易关键要素的概况。日K线高开低收数据即是经典的日内交易特征。K线理论中,高开低收的形态可用于反映多空博弈强弱。本篇报告试图挖掘其他日内交易细节,刻画有效的日内交易特征。

本报告首先使用个股1分钟级别的数据构造了一系列反映个股日内交易特征的日度指标,并由此构造了月度ALPHA;其次,对日内交易特征在组合构建端的应用给出相应的建议;最后,基于日内交易特征构建了基础的选股模型。

基于日内交易特征的选股模型既是传统多因子模型下的因子补充,也是介于传统多因子模型和短周期量价模型的折衷方案,其超额收益来源是交易行为,但通过一定收益率的方式换取更低的换仓频率,从而增加策略的可落地性。

2. 日内交易特征因子的含义和有效性检验

利用个股分钟级别的量价数据构造月频因子,有两种算法:一种是直接把计算因子的数据频率从日转换为分钟;另一种是两步算法:首先刻画个股日内交易特征,再统计当月(过去20日)的日内交易特征,从而得到月频ALPHA因子。我们认为第二种算法更占优,其原因在于:

1. 多日的分钟级别的价格数据由于休市和集合竞价制度存在时间间隔不一致的问题,导致因子计算出现偏差。例如在使用分钟数据计算多日的波动率时,其混合了日内波动率和日间跳空波动率。

2. 利用方法一计算的因子值与使用低频数据计算的通常具有中度的相关性,而使用方法二更能突出体现个股日内交易细节信息。

因而具体而言,我们采取以下标准化处理流程计算日内特征因子:

第一步,使用1分钟数据计算个股当日交易特征(剔除日内超过2小时涨停或跌停的股票)

第二步,对于同一日不用个股的交易特征值去极值和标准化。

第三步,计算最近20日非空值平均值(空值数量小于5)

日内交易特征可分为交易情绪、参与者结构和博弈状态三大类。本节分别对三大类因子特征进行举例说明,并对各因子进行有效性检验。

剔除行业与风格后因子的ICICIR采用了以下算法:

2.1. 交易情绪类因子

股价日内价格走势通常反映了投资者的交易情绪。 交易情绪类因子构建方式比较多元, 相对有效的因子包括日内 BETA 和最高价出现时间等。
举例 1:日内 BETA
因子定义: 日内 1 分钟收益率对市场平均收益回归的回归系数。

核心逻辑: 日内 Beta 越小, 表明股票走势越特立独行, 投资者情绪受市场影响较小, 预期收益越高。

举例 2:日内最高价出现时间
因子定义: 日内最高价出现的时间索引值(剔除开盘涨跌停的情况)。
hp_pos = idx ( high_price )

核心逻辑: 有悖于直觉, 最高价出现时间越早, 投资者对隔夜信息的超买现象越严重, 交易情绪越激进,未来上涨的可能性反而越高。

2.2. 参与者结构类因子 

参与者结构类因子最为推荐的因子构建方式。原因在于参与者结构因子与常见的日间技术类因子包括市值、换手率、动量或反转等相关性较小,因而能在边际上提供更多的预测性。
举例 1: 收盘成交量占比
因子定义: 收盘前 15 分钟成交量占日总成交量的比例(不包括集合竞价成交量)。

核心逻辑: 《基于微观市场结构的择时策略》提出投资者可分为知情交易者、趋势追踪者、跟随交易者三大类。 由于 T+1 交易制度的存在, 缺少信息的跟随交易者更倾向于尾盘交易,不愿承担日内波动。 跟随交易者越多, 投机性越高, 预期收益越低,反之,长线投资者越高,预期收益率越高。 因而,因子与预期收益率为负向关系。

该因子为我们所测因子中 IC 最高的因子, 且多空表现均较为稳定,因而可以作为多头选股因子。

举例 2: 正成交量指标 PVI
因子定义: 放量时收益率之和

核心逻辑: 根据费班克教授的观点, 股票越是散户主导的市场。 散户通常是一个喜欢追涨杀跌的群体,因此,当行情出现价涨量增的走势时,“散户群” 参与度会较高。 因而, PVI 用于侦测行情是否属于散户市场,PVI 越大,股票越是散户主导的市场。

2.3. 博弈类因子 

测试中表现最好的博弈状态类因子为风险模糊度 VoV (参见《基于风险模糊度的选股策略》)。 其他相对有效的因子包括量价背离、变异数比率等。 博弈状态类因子主要刻画了交易多空双方日内博弈的过程。
举例 1: 量价背离
因子定义: 日内价格与成交量的负相关性
核心逻辑: 日内缩量上涨或者放量下跌优于放量大涨或缩量下跌, 缩量上涨的股票,其交易中所负载的信息含量大、 信息不对称程度高, 因而动量较强(参见《基于流动性偏好的风格配置策略》)。
相关性衡量方式: 非平稳时间序列相关性

我们在《基于短周期价量特征的多因子选股体系》中发现了日间的量价背离对未来短期收益率有一定的预测能力。同样, 我们使用日内数据刻画量价背离也得到了类似的结论。在原报告基础上,我们对相关系数的计算方法进行了一定的改进。

传统的 Pearson 相关系数潜在假设了时间序列的平稳性。由于股票价格和成交量序列是非平稳序列,使用 Pearson 相关系数来衡量量价相关性并不合适;Pearson 相关系数的另一个缺点是简单地通过变量与均值的距离计算的相关系数,无法很好地把握时间序列变化的方向。

而我们使用的新的相关性计算方式很好的解决在非平稳序列情形下,同样我们构造 5000 对随机游走的时间序列,从而计算其相关系数。

从结果中,可以看到,新的相关系数均值比 Pearson 系数更接近真实值 0。除此之外,它的标准差也小于 Pearson 相关性系数的标准差。所以,新的时间序列相关系数在捕捉变量之间的独立性时完全占优于 Pearson 相关性系数。

举例 2: 变异数比率(Variance Ratio )

因子定义: 不同期间累计成交量方差比。

核心逻辑: 参照 Poterba(1987)的观点, 变异数比率反映成交量的自相关性。 变异数比率大于 1,则成交量有正的自相关性,趋势性较强。 变异数比率小于 1,则成交量有负的自相关性,均值回复较强。


该因子是所测因子中纯因子组合收益率最高的因子。我们使用 5 分钟成交量均线的方差与 10 分钟成交量均线的方差构造了变异数比率,用于反映日内成交量的趋势性。通常,若日内出现放巨量后,随后未有资金跟进,出现成交量快速回落的现象时,成交量均值回复特点明显, 表明信息连续性比较弱, 从而预期收益较低。 因此, 该因子值与预期收益率呈现正向变动的关系。

3. 日内特征因子在组合构建中的应用

在之前的报告中,我们提出了量化选股的三个步骤:基本面因子初筛、技术类因子增强和微观交易结构的再增强。我们建议对于换仓频率较高的投资再加入一步——技术面的复筛,形成量化选股的四个步骤:

第一步,基本面因子初筛;
第二步,技术类因子复筛;
第三步, ALPHA 因子增强;
第四步,微观交易结构的再增强。

若换仓频率较低(季频或以上),基本面筛选更重要; 若换仓频率高(周频或月频),技术面筛选更重要。 基本面筛选为了避免踩雷, 而技术面筛选可以避免错误时间买入正确的股票,起到个股择时的作用。更重要的原因是: 技术类多空收益率高,但绝大数因子空头要好于多头,技术类因子由于做空限制的存在, 空头在各年份都较为稳定, 因而大部分技术面因子更适用于负向排除。以波动率因子为例,高波动股票由于存在做空限制下的过度乐观现象和投资者的赌徒心态,通常估值过高,从而未来收益率走低。

基于上述思路,技术类因子可分为两类:负面排除因子与正向增强ALPHA 因子。根据因子多空的表现情况,我们针对日内特征因子进行分类,结果表明,绝大多数 IC 显著的因子仅可算作空头因子,而不能作为多头因子。其分类标准依据为是否 2010 年以来每年都有正超额收益。 我们更关注多头的稳定性, 若多头收益不稳定,则更倾向于认为该因子在多头上为风格因子,不建议做 ALPHA 增强。

负向排除因子: 日内 BETA 、 HighPrice_pos、 技术指标 PVI 、 VoV、量价相关性、 成交量变异数比率, WVAD
正向增强因子: 收盘成交量占比

结果表明,在检验的系列日内交易特征因子中,仅收盘成交量因子可作为正向增强因子,其余因子虽然某些因子多头收益较高,但仍然建议作为负面排除因子。

具体而言,我们仅使用日内交易特征因子,构建基础的选股策略进行历史回溯,以供参考。策略构建暂不考虑微观交易增强,可分为三步:

• STEP 1:基本面初筛
• 剔除净利润或营业利润为负的股票
• STEP 2: 技术面复筛
• 剔除各个负向排除因子全市场最差 1/5 的股票
• STEP 3:ALPHA 因子增强
• 行业中性后根据 ALPHA 因子(收盘成交量占比) 排序,取前 50 只股票

回测相关参数设定如下:
股票池: 全 A 市场(剔除 ST、停牌与次新)
调仓频率: 月换仓
建仓成本: 双边千分之三
加权方式: 等权
对冲指数:中证 500 等权

回测结果及相关绩效展示如下:

4. 总结与展望

本篇报告尝试用分钟级别的数据构造了一系列月频 ALPHA 因子,并对其进行了因子显著性检验。本篇报告主要借用了一些日频因子的构建方式刻画了日内交易特征。实际上,日内数据量巨大,刻画日内交易特征的方式众多,未来我们会继续开发其他日内交易特征因子,特别是多头收益稳定的因子。 

除此之外,本篇报告主要针对日内交易特征构造了月度 ALPHA 因子,考虑到技术类因子有效性衰退较快,未来会进一步探索周度换仓策略的组合构建。 

拓展阅读:

1.一个量化策略师的自白(好文强烈推荐)

2.市面上经典的量化交易策略都在这里了!(源码)

3.期货/股票数据大全查询(历史/实时/Tick/财务等)

4.干货| 量化金融经典理论、重要模型、发展简史大全

5.从量化到高频交易,不可不读的五本书

6.高频交易四大派系大揭秘

 

  • 0
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值