高斯回归(Gaussian Processes)

最新推荐文章于 2024-05-20 12:19:15 发布

吃龙虾一样能吃饱

最新推荐文章于 2024-05-20 12:19:15 发布

阅读量3.2k

点赞数 15

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_36013249/article/details/105999359

版权

1 前言

高斯分布：随机变量服从高斯分布，意味着在当前时刻，该随机变量可能取的值服从高斯分布，但它只能从分布中取一个！
随机过程：在一条时间线上，或一个数据集中，随机变量在每个位置上服从一定的分布，但在每一个位置只能取一个值，假设共有m个时间点（或数据集容量为m），则一共会产生m个取值结果，这m个取值结果便称为一个过程，因为在每一个点的取值是随机的，因此称为随机过程。我们用联合概率分布来描述随机过程：
$p(x^1=t_1,x^2=t_2,...,x^m=t_m)=p(x^1=t_1)p(x^2=t_2)...p(x^m=t_m)$
高斯过程：对于一个随机过程，如果随机变量在每个位置服从的分布是高斯分布，那该随机过程就称为高斯过程；但在高斯过程中，对于m个随机变量产生的结果 $\mathbf{x}=\{x^1,x^2,...,x^m\}$ ，我们不再使用联合概率分布来描述，而是使用多维高斯分布的二阶统计量来描述： $\mathbb{E}[\mathbf{x}]\in\mathbb{R}^m$ 和 $cov[\mathbf{x}]\in \mathbb{R}^{m\times m}$ ；

在贝叶斯线性回归问题中，我们建立了如下模型：
$y(x)=w^T\Phi(x),\quad\Phi(x)\in R^n,w\in R^n\tag{1.2.1}$
参数 $w$ 服从一个高斯先验分布：
$p(w)=\mathcal{N}(w|0,\alpha^{-1}I^{n\times n})\tag{1.2.2}$
因此对于一个数据集 $\mathbf{x}=\{x^1,x^2,...,x^m\}$ ，模型的输出 $\mathbf{y}=[y^1,y^2,...,y^m]^T$ （注意这里的模型的输出不是数据集中的标签或目标值，这里只描述了一个线性高斯模型的输出，并没有描述噪声）服从 $m$ 维高斯分布：
$\mathbf{y}=\Phi w=\left( \begin{matrix} \Phi(x^1)^T\\ ...\\ \Phi(x^m)^T \end{matrix} \right)_{m\times n}\cdot\quad\left( \begin{matrix} w_1\\ ...\\ w_n \end{matrix} \right)_{n\times 1}=\left( \begin{matrix} y^1\\ ...\\ y^m \end{matrix} \right)_{m\times 1}\sim\mathcal{N}(\mathbb{E}[\mathbf{y}],cov[\mathbf{y}])\tag{1.2.3}$
其中：
$\mathbb{E}[\mathbf{y}]=\Phi\mathbb{E}[\mathbf{w}]=\mathbf{0}\in \mathbb{R}^m$
$cov[\mathbf{y}]=\frac{1}{\alpha}\Phi\Phi^T=K\in \mathbb{R}^{m\times m}$
其中 $K$ 是Gram矩阵：
$K_{ij}=k(x^i,x^j)=\frac{1}{\alpha}\Phi(x^i)^T\Phi(x^j),\quad i,j\in[1,m]$
$k(x^i,x^j)$ 称为核函数；
因此，模型的输出 $\mathbf{y}=[y^1,y^2,...,y^m]^T$ 可以看作一个高斯过程;

关注