之前的文章介绍了alpha信号的估计误差,接下来几篇文章介绍一下在估计协方差过程中,如何调整协方差矩阵来减少估计偏差。
本文参考Menchero在2011年发表的论文Eigen-Adjusted Covariance Matrices: Improving Risk Forecasts for Optimized Portfolios。文中的截图均来自该论文。
通过文章的副标题可以看到,调整协方差矩阵的目的是为了要提高投资组合优化的风险预测能力,接下来会介绍如何做特征调整,以及调整之后,预测投资组合风险的能力。
引言
为了更好的叙述,首先定义几个基本概念。
表示第m个股票的主动收益率,
接着定义样本协方差矩阵,其中样本的时间窗口T=200
最后定义偏差统计量,这是一个用于投资组合的指标,用于判断协方差矩阵预测投资组合的风险的能力强弱。
定义
z值的标准差就是偏差统计量
其中
偏差统计量可以看成是实际的标准差和预测的标准差之比,我们希望
偏差统计量测试
前文说到,偏差统计量用于衡量组合的风险预测效果的好坏。本节我们定义4种类型的组合,并作偏差统计量测试。它们分别是个股、随机组合、特征组合、风险最小化组合。它们的含义如下:
个股:组合全额投资在一只股票上。
随机组合:组合中每只股票的权重由标准正态分布采样得到,同时要求它们的和为0。
特征组合:对样本协方差
其中
风险最小化组合:这个组合是通过优化求解得到的。我们首先给定alpha信号
到这里我们完成了四种类型的投资组合的定义,接下来我们分别对它们进行偏差统计量测试。
每个子图的横坐标表示方差,纵坐标表示偏差统计量。图中的每个点表示每一个投资组合。横坐标从左到右,表示了多个投资组合按照方差从小到大排列。
图1.a和图1.b对应了个股组合和随机组合的偏差统计量,看到了这些组合的偏差统计量分布在1附近,表明样本协方差矩阵
图1.c和图1.d的偏差统计量则说明了
图1.d则传达了一个信息,表明风险最小化组合的标准差,总是被样本协方差
仿真
我们已经发现了样本协方差矩阵
这个过程叫做仿真,那么如何体现仿真呢?由于实际中,我们无法得知真实的协方差矩阵,我们仅有样本协方差矩阵
在仿真的过程中,由于我们拥有真实的协方差矩阵
我们可以在时间序列上计算平均值
如果把每个仿真的特征组合的
在图2中,画了时间序列上的均值、1分位数和99分位数三条线,形态非常接近图1.c,说明可以利用仿真波动率偏差来代表样本协方差对特征组合风险预测的偏差。同时这三条线的形态接近,说明在时间序列上,结论比较稳定。
本节我们介绍如何做样本协方差矩阵的特征调整。首先我们利用式子
接下来我们就可以计算仿真的协方差矩阵
接着我们求仿真的特征组合,对
其中
因为
M表示仿真的次数。
接下来我们进行尺度变换,来解决正态性和平稳性的问题。
我们将仿真的波动率偏差相对于1做了一个偏离,
在实际情况中,
其中
接着我们将去偏差的矩阵还原成资产的协方差矩阵,
到这里就完成了资产协方差矩阵的特征调整。
我们利用
我们发现图3.a中,个股组合的偏差统计量不如图1.a,原因是在原来的
但是好消息是,其余三幅图的偏差均在1附近,尤其是图3.c和图3.d。表明了我们去除了样本协方差对特征组合方差预测的偏差。而且,实际情况中,我们常常面临的场景是对一个组合进行风险的预测,从这个角度来说,做特征调整是好的。
总结
本文考察了样本协方差矩阵在特征组合上的风险预测能力,发现了它的不足。通过特征调整的办法,消除了对特征组合进行风险估计的偏差。虽然引入了个股的风险估计偏差,但是从组合构建角度来说,调整过后的协方差矩阵对组合的风险估计要更加准确,减少了风险高估和低估的程度。对于做投资组合优化来说,更加接近于控制真实的组合风险,从而提升组合的性价比。