快速入门高斯过程(Gaussian process)回归预测

前言

这篇文章主要是教会你如何快速了解高斯过程进行回归预测的,并没有太多的公式推导,只有简单的相关的概念的介绍,如果您要自己掌握并使用高斯过程进行一个简单的预测,当然还需要进行一些基础知识学习的,我会在文章最后推荐一些博主有关高斯过程详细介绍的文章。

  • 话不多说,首先我们看一下面这道题目。这里该不会有人不知道“回归”的意思吧,简单讲回归就是一种拟合,把孤立的东西联系起来,找到规律,这就叫回归。正如题目所示,我们知道了六个点的纵坐标,要预测第七个点的纵坐标。我想很多人都知道线性回归的吧,也就是用y=kx+b来代表整个数据点的趋势,虽然数据点不能完全在这直线上,但是也可以通过这个表达式预测出第七个点(x=0.2)的纵坐标。但是记住,本篇文章是高斯过程回归预测呀!!!也就是我们要用高斯过程来进行回归并预测。接下来介绍一些基础的概率论的知识~

请添加图片描述

  • 我们看到一维高斯分布(正态分布)的概率密度函数决定因素有两个:均值和方差
    (标准差)。因此我们可以得到一个结论:一个均值和一个方差可以确定一个一维的高斯分布!!!!

请添加图片描述

  • 我们再看下面一幅图,这是二维高斯分布的概率密度函数,我们将这幅图分别从XOZ和YOZ两个方向看,我们可以看到两个方向得到的截面完全遵循一维高斯分布,那么动动小脑瓜想想,有两个一维高斯分布是不是需要两个均值和方差来确定,那么也就是说,两个均值和两个方差可以确定一个二维高斯分布,不妨把这个假设扩展到n维。

请添加图片描述

  • 从下图我们看出关于n维高斯分布的表达式,和一维高斯分布进行对比你们能更好理解了吧~

请添加图片描述

  • 接下来给大家引入一个超级超级重要的名词:“协方差”!!!!!这个名词非数学专业的想必以前都没有遇见过吧。我之前遇到这个东西也不明白它是啥以及他能干嘛。实际上在多维的高斯分布当中,两两分布之间肯定存在某种联系,那这种联系如何表达呢?脑袋瓜拍一拍,矩阵!是不是,矩阵那么多元素,是不是可以将每个元素代表两个东西之间的某种关系呢~按照上面的陈述,n维的高斯分布需要n个均值和n个方差来确定,通常情况下我们将均值定为一个均值向量,方差组用一个矩阵来表示——协方差矩阵,当两两分布之间相互独立,则这个协方差矩阵为对角矩阵,反之为非对角矩阵。

请添加图片描述

  • 那么我们在动自己脑袋瓜想想,一个均值和一个方差能确定一个一维的高斯分布,那么多维的高斯分布如何确定的呢?emmmmmmmmmm,没错,一个均值向量和一个协方差矩阵确定一个多维的高斯分布啦~

请添加图片描述

好啦~讲了这么多背景知识,可能你还是比较懵,但是没关系呀如果初步想了解高斯过程,这些知识是可以的,下面我们要开始正题了——高斯过程!

高斯过程初探

  • “如果多元高斯分布的随机变量为无数个,且是离散时间的状态量,即随机变量为随时间变化的函数。其中每个时刻的均值用一个均值函数刻画,两个不同时刻的方差用一个协方差函数刻画。”这句话什么意思呢?也就是说我现在将多维高斯分布的维数放大到无限大,其中均值向量里的每个元素都遵循一个函数——均值函数,就是说你给我这个无限维的高斯分布中某一维的高斯分布,我可以根据均值函数给出这一维高斯分布的均值。那么同理啦~我们设置一个协方差函数,这个协方差函数可以根据需要而给出对应的协方差矩阵,至于怎么给出的我们下文继续。那么,老问题来了,一个高斯过程由什么确定呢?emmmmmmmm,没错!一个高斯过程可以由一个均值函数和一个协方差函数来确定!

请添加图片描述

  • 想必大家还是对协方差函数有些懵逼吧,我们这讲讲协方差函数,协方差函数又称为核函数,呸呸呸!怎么又多了个核函数了,头又大了!!咱们不管,咱们只要知道协方差函数=核函数就行啦,贴图大王又来啦,看图片哟。左下角我给出一个协方差函数,这个函数是经典的高斯核函数,(ps:并不是高斯过程就必须要用高斯核函数哟,没关系,只是经典的高斯核函数比较简单,方便理解呀!)那么一个协方差函数如何确定一个协方差矩阵呢?你看看右下角嘛,不就出来了吗。嘻嘻嘻,懒人如我哟~

请添加图片描述

  • 大家再回到本文的正题高斯过程呀。我们把无限维的高斯分布,每一维按时间线或者其他量展开,就得到一个高斯分布的曲线啦,这个曲线中的每一个点都对应了一个一维的高斯分布,而每个高斯分布都有一个均值和方差,故高斯过程中每个点对应一个均值和方差,如下图所示哟~

请添加图片描述

高斯过程回归预测

  • 我们现在要是做题啦,如何用高斯过程来做预测呢?

请添加图片描述

  1. 首先我们第一步要确定这些孤立的点是遵循一个高斯过程的,但是高斯过程又是由一个均值函数和一个协方差函数来确定的,也就是说我们要找均值函数和协方差函数,这里我们不妨设均值函数为常数0,也就是每个点对应的高斯分布的均值为0!那么协方差函数怎么确定呢?我们采用一个经典的高斯核函数的变形来确定这个高斯过程的协方差函数,函数表达式中有没法确定的未知量,我们称之为超参数!!!具体内容看图片呀~

请添加图片描述

  • 是呀,现在我们确定了一个高斯过程,我们怎么做预测呢?贝叶斯!!!大家都有所耳闻吧,那个大名鼎鼎的贝叶斯!贝叶斯给我们提供了一个方法,简单讲就是我们可以从已知条件中推出未知内容,俗称贝叶斯推断。复杂讲的话就是如下图所示啦,也就是的贝叶斯的概率表达,贝叶斯之所以这么强大是因为我们生活中面临的很多问题是知道了结果不知道原因,而贝叶斯推断能让你从结果推原因,厉害吧,那么我们通过贝叶斯推断可以推出我们要求的未知点的表达式(具体推导过程我这里不给出来了,因为没有必要知道,会用就行,推导过程的文章链接我会放到文章结尾)。第二幅就给你们补补贝叶斯的知识吧~

请添加图片描述
请添加图片描述

  1. 重新回到高斯过程回归预测的题目上来吧,我们知道了高斯过程的均值函数和协方差函数,通过贝叶斯推断求出了所要求的点条件概率均值和方差的表达式啦~

请添加图片描述

  1. 你看看是不是可以求了呢,知道了数据,知道了表达式,不就是往里面带数据嘛!!!等等!!好像之前提到协方差函数里有未知量也就是超参数没有确定?要不往上翻翻是不是有这么个东西,肯定没错啦,就是超参数没有确定啦,可是,超参数怎么确定呢?通常情况下要求似然估计最大,至于为什么要最大,我觉得没必要理解啦,可以看文章结尾处的链接啦,但是,我们看看最大似然估计的表达式啦,毕竟要求出超参数的,我们可以选择自己喜欢的一种最优算法求超参数,这里超参数如图所示啦~

请添加图片描述

  • 最后一步啦,就真的是带数据啦!不多说,继续放图~你看看这结果漂亮不

请添加图片描述

  • 最后的最后!!一定要对高斯过程回归预测进行一个总结了!!只有条理清晰才能求解出来呀~

请添加图片描述

答应的事呀~

  • 有关高斯过程一些公式的详细推导可以看这个博主的文章哟~知乎用户
    (https://www.zhihu.com/people/singinginthewind/posts),他的很多系列的文章详细介绍了高斯过程,我的这篇文章知识帮助你们快速的入门和上手使用高斯过程进行预测

  • 王桂波:高斯过程 Gaussian Processes
    原理、可视化及代码实现这篇文章讲解步骤也很详细,大家可以参考着看哟~(https://zhuanlan.zhihu.com/p/75589452)

————————————————
版权声明:本文为CSDN博主「摸鱼大王二百五」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_50310065/article/details/111775468

  • 18
    点赞
  • 59
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值