机器学习笔记之高斯过程(一)——基本介绍

最新推荐文章于 2022-12-01 17:28:45 发布

静静的喝酒

最新推荐文章于 2022-12-01 17:28:45 发布

阅读量1.5k

点赞数 1

分类专栏：机器学习文章标签：高斯过程随机过程多元高斯分布

本文链接：https://blog.csdn.net/qq_34758157/article/details/128064513

版权

本文深入介绍了高斯过程，一种与高斯分布相关的随机过程。首先，从一维和多元高斯分布的概念出发，然后详细阐述了高斯过程的定义，指出它是无限多个高维随机变量的集合，每个随机变量都服从高斯分布。接着，讨论了高斯过程的参数，包括均值函数和协方差函数，并强调这两个函数在描述高斯过程中的关键作用。最后，探讨了如何通过采样来理解和构建高斯过程的样本路径。

摘要由CSDN通过智能技术生成

引言

从本节开始，将介绍高斯过程。

高斯过程简单介绍

高斯过程(Gaussian Process)，从名字中很明显，它是一种和高斯分布相关的随机过程(Stochastic Process)。
从一维高斯分布开始，此时只有一个一维随机变量 $x_1$ ，它服从的高斯分布可表示为：
$\mathcal P(x_1) \sim \mathcal N(\mu,\sigma^2) = \frac{1}{\sigma\sqrt{2\pi}} \exp [- \frac{(x - \mu)^2}{2\sigma^2}]$
如果样本并不是一个特征，而是多个特征，并且这些特征均服从高斯分布。假设对应的随机变量集合 $\mathcal X = \{x_1,x_2,\cdots,x_p\}$ ，那么 $\mathcal X$ 服从的是一个多元高斯分布：
$\mathcal P(\mathcal X) \sim \mathcal N(\mu,\Sigma) = \frac{1}{(2\pi)^{\frac{p}{2}}|\Sigma|^{\frac{1}{2}}} \exp \left\{- \frac{1}{2} (\mathcal X - \mu)^T \Sigma^{-1}(\mathcal X - \mu)\right\}$
在高斯网络基本介绍中，这个多元高斯分布描述了 $\mathcal X$ 内部各随机变量之间的条件独立性，并且这些条件独立性信息由精度矩阵(Precision Matrix)记录。
很明显，这是一个静态概率图模型，高斯网络中的节点数量与 $\mathcal X$ 中随机变量的数量相关。

而高斯过程可以理解为联合正态分布的无限维广义延伸。但这里的无限维是指从时间、空间等连续域中产生的维度。以时间为例，一段连续时间内，可能包含若干个状态，而每个状态的随机变量均服从高斯分布。并且每个状态的随机变量不一定是一维的，也可能是高维的。

因此，可以将高斯过程其理解为：在连续域上的无限多个高维随机变量组成的随机过程。和之前介绍的马尔可夫链相似，这里的连续域通常指时间、空间，或者是指抽象的时间，例如序列。

对场景进行如下构建：

假设时间 $\mathcal T$ 表示某个连续域，而 $t$ 表示连续域 $\mathcal T$ 中的某个时刻。
$t$ 是对连续域 $\mathcal T$ 宏观时刻的一种表示。
这个连续域 $\mathcal T$ 中可能包含很多时刻，用 $t_i(i=1,2,\cdots)$