线性因子模型

最新推荐文章于 2022-05-17 11:30:52 发布

置顶如若明镜

最新推荐文章于 2022-05-17 11:30:52 发布

阅读量5.1k

点赞数 2

分类专栏：机器学习文章标签：线性因子模型 Linear factor model

本文链接：https://blog.csdn.net/enjoyyl/article/details/50789717

版权

机器学习专栏收录该内容

33 篇文章 0 订阅

订阅专栏

原文出处：Linear Factor Models

一般线性因子模型A Generic Linear Factor Model
- 公式
- 关键假设
术语Terminology
分解收益Decomposing Returns
因子模型的矩阵表示Matrix Representation of Factor Models
我的一点浅显的理解

一般线性因子模型（A Generic Linear Factor Model）

公式

线性因子模型（Linear Factor Model），反映了资产（asset，即股票、债券、共同基金或其他资产）收益与有限数量的影响因子的关系，可以用一个线性方程描述。一般地，写为：

r i = b i 1 * f 1 + b i 2 * f 2 + \dots + b i m * f m + e i

$r_i=b_{i1}*f_1+b_{i2}*f_2+\cdots+b_{im}*f_m+e_i$

其中：

$r_i=$ 资产 $i$ 的收益（the return on asset i）
$b_{i1}=$ 因子 $1$ 单位变化带来的资产 $i$ 的收益变化
$f_1=$ 因子 $1$ 的值
$b_{i2}=$ 因子 $2$ 单位变化带来的资产 $i$ 的收益变化
$f_2=$ 因子 $2$ 的值
$\cdots=$ 项 $b_{ij}*f_j \space\space ( j=3, \cdots , m-1)$
$b_{im}=$ 因子 $m$ 单位变化带来的资产 $i$ 的收益变化
$f_m=$ 因子 $m$ 的值
$m=$ 因子数量
$e_i=$ 与 $m$ 个因子无关的资产 $i$ 的收益部分，即“残差”

需要说明的是，有时会为了区分那些在事实确定前假设已知的变量（即模型参数）与事实确定前未知的变量（即随机变量），可能会写成如下形式：

r i^= b i 1 * f 1^+ b i 2 * f 2^+ \dots + b i m * f m^+ e i^

$\hat{r_i}=b_{i1}*\hat{f_1}+b_{i2}*\hat{f_2}+\cdots +b_{im}*\hat{f_m}+\hat{e_i}$

其中，变量上方的的 $\hat{}$ 表示该变量的值事先是不知道的，即不确定统计变量。这样，由于我们不知道因子（ $\hat{f_1}, \hat{f_2}, \cdots , \hat{f_m}$ ）的值，从而无法知道资产收益 $\hat{r_i}$ ，当然也不知道残差 $\hat{e_i}$ 。相反我们知道收益在每个因子上的敏感性（ $b_{i1}, b_{i2}, \cdots, b_{im}$ ），它们是确定的，不受不确定性约束。换种说法，它们是模型的参数。

关键假设

因子模型等式看似描述了资产收益与枚举因子间的显著关系，但事实并非这样。比如，你可以选择任意集合 $\{b_{ij}\}和\{f_{j}\}$ ，然后定义残差为：

e i^= r i^- (b i 1 * f 1^+ b i 2 * f 2^+ \dots + b i m * f m^)

$\hat{e_i}=\hat{r_i}-( b_{i1}*\hat{f_1}+b_{i2}*\hat{f_2}+\cdots +b_{im}*\hat{f_m})$

方程依然精确成立，但没有任何经济学意义，为使其具有经济学意义，需作两个假设

第一个假设：假设收益残差 $\hat{e_i}$ 与各因子无关，即：

c o r r (e i^, f j^) = 0, j = 1, 2, \dots, m

$corr(\hat{e_i}, \hat{f_j})=0, \space j=1, 2, \cdots, m$

然而，它并非看起来那么严格，考虑一种情况：残差与因子1相关，通过适当调整参数 $b_{i1}$ ，残差和因子间的相关性能够接近0，这对其它因子也是一样的。事实上，利用历史数据，采用多元线性回归可以与每个因素都不相关的参数解集 ${b_{ij}}$ 。为什么？因为标准线性回归就是求最小化残差的方差（这里 $e_i$ ）的系数解集（这里 ${b_{ij}}$ ）。由于改变一个或多个参数 $b_{ij}$ 的值，都将减小残差的方差，这将确保残差与每个独立变量（这里 $f_j$ ）间是不相关。

这样，“残差与各因子不相关”这个假设用起来很方便，但没有为线性因子模型带来更多性能。

线性因子模型的关键假设是：一个资产收益的残差与任何其它资产的残差是不相关的。即不同资产收益的残差不相关。

c o r r (e i^, e j^) = 0, (i, j = 1, 2, \dots, m, i \neq j ）

$corr(\hat{e_i}, \hat{e_j})=0, \space (i,j=1, 2, \dots, m, \space i \ne j）$

这意味着，资产总收益间的相关性的唯一来源，就是风险因素及各因素间的协方差。资产收益的残差部分被假定与任何其他资产无关，因此对该资产完全确定。换句话说，与残差收益相关的风险，问题资产中的特殊性。

这种假设使得线性因子模型更有意义，在这个意义上，它排除了许多可能的收入组合。但这是有代价的。模型越限制越多，它可能与现实就越不一致。为此，分析师通过包括足够数量的因素，并尝试关注最为重要的，来试图捕捉资产收益间相关性的最重要来源，这也是其职责。这是说，在构建任何模型时，节俭是一种美德，目标就是包含“信号”，避免“噪声”。

术语（Terminology）

分解收益（Decomposing Returns）

因子模型的矩阵表示（Matrix Representation of Factor Models）

我的一点浅显的理解

线性因子模型其实就是一个线性方程，与其它线性模型也有着一些联系，比如考虑线性方程：

y = a 1 * x 1 + a 2 * x 2 + \dots + a m * x m

$y = a_1*x_1+a_2*x_2+\cdots +a_m*x_m$

其中 $x$ 是自变量，也就是变化的因素，即因子； $y$ 是因变量，因因子 $x$ 的改变而改变；而将上述等式看作一个线性模型，系数 $a$ 就是模型参数，对应着线性因子模型中的参数 b <script type="math/tex" id="MathJax-Element-47">b</script>（factors exposure）。