excel中如何对矩阵得对角线进行求和_协方差矩阵估计：特征调整

最新推荐文章于 2024-04-04 01:00:00 发布

weixin_39657125

最新推荐文章于 2024-04-04 01:00:00 发布

阅读量611

点赞数

文章标签： excel中如何对矩阵得对角线进行求和

之前的文章介绍了alpha信号的估计误差，接下来几篇文章介绍一下在估计协方差过程中，如何调整协方差矩阵来减少估计偏差。

本文参考Menchero在2011年发表的论文Eigen-Adjusted Covariance Matrices: Improving Risk Forecasts for Optimized Portfolios。文中的截图均来自该论文。

通过文章的副标题可以看到，调整协方差矩阵的目的是为了要提高投资组合优化的风险预测能力，接下来会介绍如何做特征调整，以及调整之后，预测投资组合风险的能力。

引言

为了更好的叙述，首先定义几个基本概念。

表示第m个股票的主动收益率，

是t天的市场收益率。一般会定义为股票的市值加权收益率。根据性质，

的市值加权求和的结果等于0。

接着定义样本协方差矩阵，其中样本的时间窗口T=200

最后定义偏差统计量，这是一个用于投资组合的指标，用于判断协方差矩阵预测投资组合的风险的能力强弱。

定义

为投资组合第t天的收益率，

为t-1天收盘时给出的组合标准差预测。利用

对

做标准化，得到t天的z值。

z值的标准差就是偏差统计量

其中

是测试窗口的大小，可以设置成滚动窗口。

偏差统计量可以看成是实际的标准差和预测的标准差之比，我们希望

。但是这往往不现实，因此我们会设置一个置信区间，希望它落在这个置信区间内，95%置信区间对应的B值范围是

。当B值大于1时，表明预测的标准差低于实际的标准差，即低估了。反之则高估了。

偏差统计量测试

前文说到，偏差统计量用于衡量组合的风险预测效果的好坏。本节我们定义4种类型的组合，并作偏差统计量测试。它们分别是个股、随机组合、特征组合、风险最小化组合。它们的含义如下：

个股：组合全额投资在一只股票上。

随机组合：组合中每只股票的权重由标准正态分布采样得到，同时要求它们的和为0。

特征组合：对样本协方差

做对角化得到矩阵

，使其不在对角线上的元素为0。

其中

是

的矩阵，每列代表一个特征组合。而对角矩阵

中，对角线上的每个元素表示了特征组合对应的方差。大家回顾一下PCA的知识就明白了。

风险最小化组合：这个组合是通过优化求解得到的。我们首先给定alpha信号

和协方差矩阵

，在满足投资组合的alpha值

的条件下，最小化方差得到的投资组合，可以写成

到这里我们完成了四种类型的投资组合的定义，接下来我们分别对它们进行偏差统计量测试。

图1：利用样本协方差V0进行的偏差统计量测试

每个子图的横坐标表示方差，纵坐标表示偏差统计量。图中的每个点表示每一个投资组合。横坐标从左到右，表示了多个投资组合按照方差从小到大排列。

图1.a和图1.b对应了个股组合和随机组合的偏差统计量，看到了这些组合的偏差统计量分布在1附近，表明样本协方差矩阵

对这类型的投资组合的风险预测能力还不错。

图1.c和图1.d的偏差统计量则说明了

无法应对这类型的组合。尤其是图1.c，它传达了一个信息，就是将特征组合按照其方差从小到大排，最小方差的特征组合，其偏差统计量达到了1.7以上，表明它的标准差被

给低估了。而最大方差的特征组合的偏差统计量低于1，表明它的标准差被低估了。

图1.d则传达了一个信息，表明风险最小化组合的标准差，总是被样本协方差

给低估了，表明如果利用

去做组合优化，达不到最小风险的效果。

仿真

我们已经发现了样本协方差矩阵

对投资组合的风险预测存在偏差，尤其是对于特征组合而言，那我们想要将这种偏差去除，首先要找到一种方法来定量这种偏差。接下来我们会给出一个概念：仿真的波动率偏差。

这个过程叫做仿真，那么如何体现仿真呢？由于实际中，我们无法得知真实的协方差矩阵，我们仅有样本协方差矩阵

，那么我们就把

暂时当成是真实的协方差矩阵。通过它来随机采样一些收益率样本，整个采样过程服从正态分布，且收益率序列是平稳的。这个收益率序列是通过仿真得到的，我们利用仿真的收益率序列，计算仿真的协方差矩阵

。对

做对角化，我们也可以得到仿真的特征组合。这个仿真的过程我们做M次，其中下标m表示第m次仿真。

在仿真的过程中，由于我们拥有真实的协方差矩阵

，因此我们可以计算仿真的特征组合的真实标准差，以及利用仿真的协方差矩阵

计算的预测标准差。我们分别定义为

和

，其中k表示第k个仿真的特征组合，那么我们就可以定义仿真的波动率偏差。

我们可以在时间序列上计算平均值

如果把每个仿真的特征组合的

画在一张图上，我们可以得到图2。

图2：仿真特征组合的仿真波动率偏差均值及分位数

在图2中，画了时间序列上的均值、1分位数和99分位数三条线，形态非常接近图1.c，说明可以利用仿真波动率偏差来代表样本协方差对特征组合风险预测的偏差。同时这三条线的形态接近，说明在时间序列上，结论比较稳定。

特征调整

本节我们介绍如何做样本协方差矩阵的特征调整。首先我们利用式子

做对角化。接着我们利用对角矩阵

，采样收益率序列，满足均值为0，方差为

，得到

，那么自然满足以下关系，得到仿真的个股收益率序列。

接下来我们就可以计算仿真的协方差矩阵

接着我们求仿真的特征组合，对

进行对角化

其中

的每一列对应一个仿真特征组合。我们利用

求解仿真特征组合的真实方差

因为

和

是不匹配的，所以

不是对角矩阵。图(2)说明了仿真特征矩阵的预测方差

是有偏的，即

。我们可以计算仿真波动率偏差

M表示仿真的次数。

接下来我们进行尺度变换，来解决正态性和平稳性的问题。

我们将仿真的波动率偏差相对于1做了一个偏离，

是一个常数，一般取1.4可以有效地去除仿真特征组合的偏差。至此我们定义了真实和预测的波动率偏差，仿真结束。

在实际情况中，

就是仿真中的

，同样面临着和

一样的估计偏差，因此我们对

进行去偏差，做法是

其中

是一个对角矩阵，元素均来自

。

接着我们将去偏差的矩阵还原成资产的协方差矩阵，

到这里就完成了资产协方差矩阵的特征调整。

的偏差统计量检查

我们利用

重复上文提到的偏差统计量检测，对象仍然是四种类型的组合。结果如下

图3：利用特征调整后的样本协方差进行的偏差统计量测试

我们发现图3.a中，个股组合的偏差统计量不如图1.a，原因是在原来的

中，对角线上的元素表示个股的方差，预测效果还不错。但是现在调整为

了，对角线上的元素值变了，从而引入的偏差。

但是好消息是，其余三幅图的偏差均在1附近，尤其是图3.c和图3.d。表明了我们去除了样本协方差对特征组合方差预测的偏差。而且，实际情况中，我们常常面临的场景是对一个组合进行风险的预测，从这个角度来说，做特征调整是好的。

总结

本文考察了样本协方差矩阵在特征组合上的风险预测能力，发现了它的不足。通过特征调整的办法，消除了对特征组合进行风险估计的偏差。虽然引入了个股的风险估计偏差，但是从组合构建角度来说，调整过后的协方差矩阵对组合的风险估计要更加准确，减少了风险高估和低估的程度。对于做投资组合优化来说，更加接近于控制真实的组合风险，从而提升组合的性价比。