施密特正交化_量化投资因子正交化

本文介绍了因子正交化的背景和意义,特别是针对因子多重共线性问题,讨论了施密特正交化、回归取残差、规范正交化和对称正交化四种方法。通过实例展示了不同正交化方法对因子组合表现的影响,其中对称正交化能有效消除因子相关性。
摘要由CSDN通过智能技术生成

原创: 量化小白H 量化小白上分记 

本系列的第一篇因子加权方法中提到,对于因子间有相关性的情况,可以通过最大化IR来解决,但也会存在另一个问题:因子协方差矩阵的估计,文中对比了最原始的样本协差阵和Ledoit压缩估计量结果的差异,表明协方差矩阵的估计效果对于结果有很大影响。本文给出另一种更为常用的解决因子间相关性的方法:因子正交化。

01

背景

因子多重共线性

如上一篇所述,传统的多因子模型一般采用IC加权、ICIR加权等方法,这些方法都是以IC为基础确定各因子在模型中的权重。而IC是当期因子暴露与下一期收益间的相关系数。如果因子间存在较强的相关性/相关性,通过上述加权方式,最终会导致因子对于某种风格的因子重复暴露。使得整个组合的表现严重偏向于该因子,削弱其他因子的效果。具体来说,当因子表现好时,组合会获得更高的超额收益,但因子表现不好时,也会出现更大幅的回撤。

举个栗子,在上篇三因子组合市净率1个月动量市值的基础上,加入流通市值因子进行四因子组合。采用过去24个月ICIR加权、月度调仓的方式。组合从2012年1月-2018年12月的表现如下

ee7f7871ff1998810dc087e7826357a0.png

基准采用沪深300指数,显然,四因子组合由于在估摸因子上的重复暴露,导致15年股灾之后,相较于三因子组合出现了超额增长,但在17年规模因子失效后出现了更大回撤。

正交相关定义

首先给出正交相关的一些概念,忘记的可以再翻一翻线性代数/高等代数。

fe8d06dd75891898dd37020b0ca88560.png

此外,有兴趣可以再去看看正交变换、旋转放缩变换的矩阵表达式,可以加深理解。

因子正交化统一框架

对于因子多重共线性的问题ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值