原文出处:Linear Factor Models
一般线性因子模型(A Generic Linear Factor Model)
公式
线性因子模型(Linear Factor Model),反映了资产(asset,即股票、债券、共同基金或其他资产)收益与有限数量的影响因子的关系,可以用一个线性方程描述。一般地,写为:
其中:
- ri= 资产 i 的收益(the return on asset i)
bi1= 因子 1 单位变化带来的资产i 的收益变化- f1= 因子 1 的值
bi2= 因子 2 单位变化带来的资产i 的收益变化- f2= 因子 2 的值
⋯= 项 bij∗fj (j=3,⋯,m−1)-
bim=
因子
m
单位变化带来的资产
i 的收益变化 - fm= 因子 m 的值
m= 因子数量-
ei=
与
m
个因子无关的资产
i 的收益部分,即“残差”
需要说明的是,有时会为了区分那些在事实确定前假设已知的变量(即模型参数)与事实确定前未知的变量(即随机变量),可能会写成如下形式:
其中,变量上方的的 ^ 表示该变量的值事先是不知道的,即不确定统计变量。这样,由于我们不知道因子( f1^,f2^,⋯,fm^ )的值,从而无法知道资产收益 ri^ ,当然也不知道残差 ei^ 。相反我们知道收益在每个因子上的敏感性( bi1,bi2,⋯,bim ),它们是确定的,不受不确定性约束。换种说法,它们是模型的参数。
关键假设
因子模型等式看似描述了资产收益与枚举因子间的显著关系,但事实并非这样。比如,你可以选择任意集合 {bij}和{fj} ,然后定义残差为:
方程依然精确成立,但没有任何经济学意义,为使其具有经济学意义,需作两个假设
- 第一个假设:假设收益残差 ei^ 与各因子无关,即:
然而,它并非看起来那么严格,考虑一种情况:残差与因子1相关,通过适当调整参数 bi1 ,残差和因子间的相关性能够接近0,这对其它因子也是一样的。事实上,利用历史数据,采用多元线性回归可以与每个因素都不相关的参数解集 bij 。为什么?因为标准线性回归就是求最小化残差的方差(这里 ei )的系数解集(这里 bij )。由于改变一个或多个参数 bij 的值,都将减小残差的方差,这将确保残差与每个独立变量(这里 fj )间是不相关。
这样,“残差与各因子不相关”这个假设用起来很方便,但没有为线性因子模型带来更多性能。
- 线性因子模型的关键假设是:一个资产收益的残差与任何其它资产的残差是不相关的。即不同资产收益的残差不相关。
这意味着,资产总收益间的相关性的唯一来源,就是风险因素及各因素间的协方差。资产收益的残差部分被假定与任何其他资产无关,因此对该资产完全确定。换句话说,与残差收益相关的风险,问题资产中的特殊性。
这种假设使得线性因子模型更有意义,在这个意义上,它排除了许多可能的收入组合。但这是有代价的。模型越限制越多,它可能与现实就越不一致。为此,分析师通过包括足够数量的因素,并尝试关注最为重要的,来试图捕捉资产收益间相关性的最重要来源,这也是其职责。这是说,在构建任何模型时,节俭是一种美德,目标就是包含“信号”,避免“噪声”。
术语(Terminology)
分解收益(Decomposing Returns)
因子模型的矩阵表示(Matrix Representation of Factor Models)
我的一点浅显的理解
线性因子模型其实就是一个线性方程,与其它线性模型也有着一些联系,比如考虑线性方程:
其中
x
是自变量,也就是变化的因素,即因子;