目录
2 高斯过程回归(Gaussian Process Regression)
0 参考资料
[1] 文字资料:Gaussian Processes for Machine Learning
[2] 视频讲解:机器学习-白板推导系列(二十)-高斯过程GP(Gaussian Process)(目测视频中的内容也是借鉴的上面的文字资料,不过通过讲解可能更好懂一些,视频中完整讲述了高斯过程回归的weight space view和function space view,两者完全等价,我在博客中只讲解后者,因为后者更直接明了)
1 高斯过程定义
假设是一个连续域,对于中的每一个点,都有一个其对应的变量。
如果我们任意选取一组点,都有对应变量的联合分布服从多维高斯分布(注意当只选取一个点时则服从一维高斯分布),那么就将称为一个高斯过程。
由于是连续域,可以随机去任意多点,因此可以看做是在这个连续域上的无限维高斯分布。
在实际采样时,我们无法采样无限多的点,因此假设我们每次采样的位置是,注意每个点对应的是一个随机变量而不是一个具体的值,因此如果我们要对一个GP在这一组点上进行采样,每次随机变量对应的值不一定相同,即每次都是从该随机变量服从的高斯分布中采样一个值。
可以认为高斯过程由两个函数确定,即,其中是均值函数,是协方差函数。
2 高斯过程回归(Gaussian Process Regression)
高斯过程可以被看作是对函数的分布的定义,将函数看做随机变量,则有,其中输入。
对应有和。
考虑回归问题:
现有完整数据,令
则有,其中是随机噪声。
新数据(用于预测)
根据,我们只要求出即可。
先写出现有数据(完整数据,用于训练)和新数据(用于预测)的联合概率分布:
我们要求的是
有如下公式:
代入公式得
这是的后验分布,也即无噪声情况下的后验分布。
当有噪声时,