1 总述
对于贝叶斯优化,总体可以分为两个部分,概率代理模型和采集函数。
2 概率代理模型和采集函数
概率代理模型:根据模型的参数个数是否固定可分为:参数模型和非参数模型。常见的参数模型有:贝塔-伯努利(Beta-Bernoulli)模型和线性(linear)模型。常见的非参数模型有高斯过程、随机森林等。本文介绍应用范围最广的高斯过程。
采集函数:主要根据后验概率代理模型,选择下一个具有潜力的评估点。
2.1 高斯过程
由于高斯过程的参数维度随着观测点的增加而增加,非固定,因此被归类为非参数模型(并非没有参数)。
高斯过程可以看成是一个函数,这个函数的输入是 x t + 1 x_{t+1} xt+1,函数的输出是在当前输入 x t + 1 x_{t+1} xt+1下的预测值在高斯分布下的均值和方差。
在训练中,主要涉及协方差矩阵的计算和超参数的优化。
2.2 采集函数
采集函数:对于采集函数需要一方面尽可能的探测未知的空间(未评估过的参数组合),这样概率代理模型才能更加接近真实的未知函数。另一方面,根据已经找到的最优值,加大在其周围搜索参数的力度,以期更加迅速的找到全局最优值。这两方面往往是矛盾的,需要在两者之间找到一个平衡点。常见的采集函数有三种:probability of improvenment(PI)、Expected improvement(EI)、Upper confidence bound(UCB)。
3 贝叶斯调参过程
问题简单描述:假设参数有n个,性能为y。贝叶斯初始需要输入一组观测点 { y 1 , X 1 } , { y 2 , X 2 } , { y 3 , X 3 } \mathop \{y_{1},X_{1}\},\{y_{2},X_{2}\},\{y_{3},X_{3}\} { y1,X1},{ y2,X2},{ y3,X3}。其中 X = { x 1 , x 2 , . . . , x n } \mathop X = \{x_{1},x_{2},...,x_{n}\} X={ x1,x2,...,xn}。
-
更新概率代理模型,首先计算协方差矩阵
K = [ k ( X 1 , X 1 ) k ( X 1 , X 2 ) k ( X 1 , X 3 ) k ( X 2 , X 1