贝叶斯优化（BO）是什么？整个流程是怎么样的？代理模型 + 采集函数

Pengsen Ma

已于 2024-09-12 14:08:56 修改

阅读量2.4k

点赞数 1

分类专栏：多目标优化文章标签：算法人工智能机器学习

于 2023-11-05 10:49:36 首次发布

本文链接：https://blog.csdn.net/weixin_43135178/article/details/134227675

版权

多目标优化专栏收录该内容

25 篇文章

订阅专栏

首先需要清楚的是：BO是黑盒优化，这个黑盒我们是不知道的，所以我们需要通过使用“代理模型”不断地逼近真实的黑盒所代表的函数，然后使用“采集函数”采集到更优点

得到训练好的“代理模型”后，就可以结合其他多目标优化算法来求得Pareto 解集了。这是因为BO面对的问题是黑盒优化，这个黑盒的计算成本很大。说白了，BO的“代理模型”就是学习一个输入和输出的关系，它可以替代神经网络预测分子活性的模型等等。

来自：Computer-aided multi-objective optimization in small molecule discovery

一个图了解整个BO的流程是什么样的：

其步骤主要是：

整个BO流程：在贝叶斯优化的每次迭代中，我们使用代理模型来预测未知点的性能，并用采集函数来选择下一个评估点。然后，我们在实际的目标函数（黑盒模型）上评估这个点，更新代理模型，然后再次迭代。这个过程不断重复，直到满足某个停止条件，例如达到一定的迭代次数、时间限制或解的质量。随着更多候选点的评估，代理模型变得越来越精确，使得优化过程逐渐靠近全局最优解（代理模型变得越来越精确，这样就可以更准确地指导采集函数选择下一个有价值的点来评估）。

一些概念：

1、代理模型（Surrogate Model）

代理模型是一个用于近似真实目标函数的统计模型。因为在很多情况下，目标函数可能非常复杂或者计算代价很高，我们不可能去穷举所有可能的输入值来找到最优解。所以，我们需要一个代理模型来模拟目标函数的行为，这样就可以更快地估计函数在未探索点的输出。【因为BO是黑盒优化，并且每一次这个黑盒模型输出一个值所需要的开销很大，所以我们用黑盒模型输出的寥寥几个值去模拟一个黑盒模型所代表的黑盒函数，也就是上述步骤的 f*】

在贝叶斯优化中，常见的代理模型是高斯过程（Gaussian Process, GP）。高斯过程是一种非常灵活的模型，能够估计函数的预测值以及这些预测值的不确定性（即预测值的置信区间）。其他代理模型还可以是随机森林、神经网络等，但高斯过程是最常用的，因为它天然的概率性质很适合贝叶斯优化的框架。