![3ccdab95-d915-eb11-8da9-e4434bdf6706.png](http://p01.5ceimg.com/content/3ccdab95-d915-eb11-8da9-e4434bdf6706.png)
投资是最具有挑战性的工作之一,因为我们需要时时刻刻与不确定性作斗争。在努力获得超额回报的同时,我们也在谨慎管理着风险。为了在风险和收益中获得一个平衡,“投资组合理论”进入了我们的视野。“投资组合理论”的核心就是分散投资,即Diversification。在《一文讲清楚分散投资(上)——是天真等分还是依靠有效边界模型?人类的思维模式告诉你答案》文章中,我跟大家讲述了“投资组合理论”的提出者Markowitz如何为自己投资的小故事。这个小故事告诉我们以下几点:
1,用“期望均值-方差”模型计算出的投资组合权重比例依赖于历史数据,并不能准确的预测未来,有过度拟合(Overfitting)的风险,使得实际结果与预期相差甚远;
2,“期望均值-方差”模型对输入(Input)非常敏感,在输入端做小的改变可能会使得输出的权重(Output)大变样,投资组合的波动很大,周转率高,交易成本增加;
3,如果有一个投资产品的历史数据优秀(较高收益,较小的价格波动),使用模型确定权重会使得该产品得到非常大的比例,权重开始集中并倾斜,违背了分散投资的初衷。
因此,很多时候,天真的1/N策略(即将资金平均分配给每一个投资产品)反而会得到更好的结果。这也是Markowitz宁愿天真等分也不去用自己的模型算一算的原因。
但是,天真的1/N策略是启发式探索式思维方式的一种应用,它追求的是“能用”而不是“最优”。作为专业投资者,我们肯定要在“能用”的基础上问自己“如何优化”,才对得起投资人对我们的信任。“期望均值-方差”的模型就需要改进,来克服上面讲到的3个问题。
“发展的问题只能通过发展来解决。”
搭建投资模型就像人生,需要困难时不要想着后退,而是要顶着压力再往前走一步,“欲穷千里目,更上一层楼”。“投资组合理论”在被人们不断的改进,今天,我就跟大家讲一讲如何用信息熵的概念完善“投资组合理论”。
首先,让我们简单了解一下信息熵。
熵(英语:entropy)是对不确定性的测量。在1948年,克劳德·艾尔伍德·香农将热力学的熵,引入到信息论,因此它又被称为香农熵(Shannon entropy)。举个例子,如果有一枚理想的硬币,其出现正面和反面的机会相等,我们无法预测下一次硬币抛掷的结果是什么,出现正面或反面的概率均等,为50%,这个事件的熵就定义为1 bit。但是如果一枚硬币的两面完全相同,那个这个抛硬币事件的熵等于0 bit,因为结果能被准确预测,没有任何不确定性。
下图为信息熵的计算公式,K为正数,观测事件可能发生的结果数为n,Pi为每个结果发生的概率。根据这个公式,当P1=P2=...=Pn时,表示着观察者对结果完全没有任何预测,只能猜所有结果发生的概率一样,是N等分,这时观测事件的不确定性最大,熵最大。
![40cdab95-d915-eb11-8da9-e4434bdf6706.png](http://p03.5ceimg.com/content/40cdab95-d915-eb11-8da9-e4434bdf6706.png)
关于信息熵和薛定谔的名句“生命以负熵为食”我就不展开叙述了。感兴趣的朋友可以看下这两位知友的回答:
思维有了模型:熵增定律:为什么那么多人因此顿悟了zhuanlan.zhihu.com![42cdab95-d915-eb11-8da9-e4434bdf6706.png](http://p03.5ceimg.com/content/42cdab95-d915-eb11-8da9-e4434bdf6706.png)
![44cdab95-d915-eb11-8da9-e4434bdf6706.png](http://p04.5ceimg.com/content/44cdab95-d915-eb11-8da9-e4434bdf6706.png)
那么如何将信息熵的概念引入投资组合理论,让高大上的“机器学习”基础帮助我们更好的做投资决策呢?
我们只需要做几个概念的替换就可以了。根据信息熵的公式,观测事件可能产生的结果有n个,每个结果发生的概率为Pi (i=1,2,...,n), 概率之和为1,即
![45cdab95-d915-eb11-8da9-e4434bdf6706.png](http://p01.5ceimg.com/content/45cdab95-d915-eb11-8da9-e4434bdf6706.png)
将上述逻辑加进“期望均值-方差”模型,我们将目标设定为:
1,加权的期望收益最大;
2,期望收益的方差最小;
3,权重的“信息熵”最大。
这样求得的权重比例就在收益、风险、分散化之间求得了一个平衡,改善了Markowitz提出的原始“期望均值-方差”模型的“偏爱某一个或某几个投资产品,不够分散”和“模型对输入的数据敏感,输出结果波动大,造成交易费用高”的问题。
熵,一个原本应用在热力学的概念,被用来衡量不确定性,从而赋予了信息可量化的单位;又被引入了投资组合理论,从而将“分散投资”这一个叙述性概念变为了可量化的数学概念。在这个演化过程中,我们看到了打破思维疆界的力量。“Think Out Of The Box”,破次元壁的思维方式会为我们打开一扇又一扇通向新世界的大门。