本文搬运于个人博客,欢迎点击这里查看原博文。
高斯过程 Gaussian Processes 是概率论和数理统计中随机过程的一种,是多元高斯分布的扩展,被应用于机器学习、信号处理等领域。本文对高斯过程进行公式推导、原理阐述、可视化以及代码实现,介绍了以高斯过程为基础的高斯过程回归 Gaussian Process Regression 基本原理、超参优化、高维输入等问题。
目录
- 一元高斯分布
- 多元高斯分布
- 无限元高斯分布?
- 核函数(协方差函数)
- 高斯过程可视化
- 高斯过程回归实现
- 超参数优化
- 多维输入
- 高斯过程回归的优缺点
一元高斯分布
我们从最简单最常见的一元高斯分布开始,其概率密度函数为
其中
多元高斯分布
从一元高斯分布推广到多元高斯分布,假设各维度之间相互独立
其中
有
代入公式(2)得到
其中
无限元高斯分布?
在多元高斯分布的基础上考虑进一步扩展,假设有无限多维呢?用一个例子来展示这个扩展的过程(来源:MLSS 2012: J. Cunningham - Gaussian Processes for Machine Learning),假设我们在周一到周四每天的 7:00 测试了 4 次心率,如下图中 4 个点,可能的高斯分布如图所示(高瘦的那条)。这是一个一元高斯分布,只有每天 7: 00 的心率这个维度。
现在考虑不仅在每天的 7: 00 测心率(横轴),在 8:00 时也进行测量(纵轴),这个时候变成两个维度(二元高斯分布),如下图所示
更进一步,如果我们在每天的无数个时间点都进行测量,则变成了下图的情况。注意下图中把测量时间作为横轴,则每个颜色的一条线代表一个(无限个时间点的测量)无限维的采样。当对每次对无限维进行采样得到无限多个点时,其实可以理解为我们采样得到了一个函数。
当从函数的视角去看待采样,理解了每次采样无限维相当于采样一个函数之后,原本的概率密度函数不再是点的分布 ,而变成了函数的分布。这个无限元高斯分布即称为高斯过程。高斯过程正式地定义为:对于所有