【深度学习-笔记】(2)--高斯过程&高斯回归

spongia丶

已于 2022-08-16 17:37:24 修改

阅读量3k

点赞数 1

分类专栏：深度学习笔记文章标签：机器学习深度学习

于 2021-11-19 11:10:47 首次发布

本文链接：https://blog.csdn.net/Myblog_7267/article/details/121375076

版权

深度学习笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

【深度学习-笔记】(2)–高斯过程&高斯回归

个人笔记，记录思考过程，已注明参考文献。
如果你看不懂他，可以试着先去接受他。就好像，打不过就加入。

文章目录

【深度学习-笔记】(2)--高斯过程&高斯回归
参考文献

一、高斯分布（正态分布）

高斯分布（正态分布）是一个常见的连续概率分布。
正态分布的数学期望值或期望值 $μ$ 等于位置参数，决定了分布的位置；其方差 $\sigma^{2}$ 的开平方或标准差σ等于尺度参数，决定了分布的幅度。正态分布的概率密度函数曲线呈钟形，因此人们又经常称之为钟形曲线（类似于寺庙里的大钟，因此得名）。
在这里插入图片描述

我们通常所说的标准正态分布是位置参数 $\mu=0$ ，方差 $\sigma^{2}=1$ 的正态分布。

1. 一元高斯分布

若随机变量X服从一个位置参数为 $μ$ ，方差为 $σ^{2}$ 的正态分布，可以记为 $X$ ~ $N ( μ , σ^{2} )$ ，则其概率密度函数为：
$f(x)=\frac{1}{\sigma \sqrt{2 \pi}} \exp \left(-\frac{(x-\mu)^{2}}{2 \sigma^{2}}\right)$
其中， $\mu$ 和 $\sigma^{2}$ 的求法不再赘述。

2. 多元（二元及以上）高斯分布

这里以二元高斯分布为例： 二维高斯分布则包含有两个变量，二维高斯分布的均值 $μ$ 由两个变量的均值描述，其方差由变量的协方差矩阵进行描述，协方差矩阵 $\Sigma$ 表示的是两个变量之间的关系（标准差和方差一般是用来描述一维数据的，而面对二维数据，则使用协方差来表示）：
$\mu=\left(\begin{array}{l} \mu_{a} \\ \mu_{b} \end{array}\right) \quad \Sigma=\left(\begin{array}{cc} \sigma_{x}^{2} & \rho \sigma_{x} \sigma_{y} \\ \rho \sigma_{x} \sigma_{y} & \sigma_{y}^{2} \end{array}\right)$
其中， $\rho \sigma_{x} \sigma_{y}$ 和 $\rho \sigma_{x} \sigma_{y}$ 分别为两个变量的协方差值。协方差的计算公式为：
$\begin{aligned} \operatorname{Cov}(X, Y) &=E[(X-E(X)(Y-E(Y)]\\ &=E[X Y]-E[X] E[Y] \end{aligned}$
其中，若为一维数据，协方差可以表示为：
$\operatorname{cov}(X)=\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)\left(X_{i}-\bar{X}\right)}{n-1}= \frac{\sum_{i=1}^{n}{\left(X_{i}-\bar{X}\right)}^{2}}{n-1}$
其实就是方差公式。而对于多维数据，为度量各个维度偏离其均值的程度，协方差可以表示为：
$\Sigma=\operatorname{cov}(X,Y)=\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)\left(Y_{i}-\bar{Y}\right)}{n-1}$
这里Σ是对称正定的n × n矩阵。具体计算可参考协方差计算。最后，二元高斯随机变量 $x$ ~ $\Sigma )$ ，其概率密度可以表示为：
$\Sigma)=\frac{1}{{(2 \pi)}^{n/2} {|\Sigma|}^{1/2}} \exp \left(-\frac{1}{2}(x-\mu)^{T} \Sigma^{-1}(x-\mu)\right)$
其中
$x=\left[\begin{array}{l} x_{A} \\ x_{B} \end{array}\right] \quad \mu=\left[\begin{array}{l} \mu_{A} \\ \mu_{B} \end{array}\right] \quad \Sigma=\left[\begin{array}{ll} \Sigma_{A A} & \Sigma_{A B} \\ \Sigma_{B A} & \Sigma_{B B} \end{array}\right]。$
在这里插入图片描述

二、高斯过程

高斯过程是指随机变量的一个集合，其中任意有限个样本的线性组合都有一个联合高斯分布。
一个高斯过程是由均值函数 $m (x)$ 和协方差函数 $k(x,x^{*})$ 确定的。它可理解成高斯分布的一个生成过程。高斯分布的均值和协方差是向量和矩阵（意思就是多维高斯分布的均值和方差是确定的值，比如均值是(0.1,0.2,0.5)。），而高斯过程的均值和方差则分别是均值函数和协方差矩阵函数。
1.有限域
设 $X =$ { ${x}_{1},...,{x}_{m}$ }是任意有限集（定义域有限），考虑所有可能的 $f : X \to R$ 所组成的函数集合 $H$ ，那么得到的 $f$ 也是有限的，用集合来表示：
$\vec{f}=\left[\begin{array}{llll} f\left(x_{1}\right) & f\left(x_{2}\right) & \cdots & f\left(x_{m}\right) \end{array}\right]^{T}$
那么有限域的高斯过程为：
$\vec{f} \sim \mathcal{N}\left(\vec{\mu}, \sigma^{2} I\right)$
其中， $I$ 为单位矩阵。 $\vec{\mu}=E(f(x))$
表达式为：
$p(h)=\prod_{i=1}^{m} \frac{1}{\sqrt{2 \pi} \sigma} \exp \left(-\frac{1}{2 \sigma^{2}}\left(f\left(x_{i}\right)-\mu_{i}\right)^{2}\right)$
2.无限域
无限域体现在由 $X$ 组成的集合中， $x$ 是随机的，有无限多的组合。假设有一个随机变量的集合：{ $\in X$ }，这里定义高斯过程是一个随机过程，满足随机变量集合的任意有限子集都服从多元高斯分布。那么设定均值函数 $m (x)$ 和协方差函数 $k({x}_{1},{x}_{2})$ 。
如果随机变量集合： $\in X$ 是从均值函数为 $m$ 、协方差函数为 $k$ 的高斯过程中取出的变量集，那么对于任意有限集合： ${x}_{1},...,{x}_{m} \in X$ ，它们相对应的随机变量 $f(x_i)$ 服从高斯分布：
$\left[\begin{array}{c} f\left(x_{1}\right) \\ \vdots \\ f\left(x_{m}\right) \end{array}\right] \sim \mathcal{N}\left(\left[\begin{array}{c} m\left(x_{1}\right) \\ \vdots \\ m\left(x_{m}\right) \end{array}\right],\left[\begin{array}{ccc} k\left(x_{1}, x_{1}\right) & \cdots & k\left(x_{1}, x_{m}\right) \\ \vdots & \ddots & \vdots \\ k\left(x_{m}, x_{1}\right) & \cdots & k\left( x_{m},{x}_{m}\right) \end{array}\right]\right)$
记为：
$f(x)\sim{GP}(m(x),k(x,x'))$
其中，均值和协方差记为：
$\\ k(x,x')=E[(x-m(x))(x'-m(x'))]$
☆☆☆扩展矩阵的协方差：（待更新）。