理解贝叶斯优化

本文深入探讨贝叶斯优化,包括概率代理模型如高斯过程和采集函数,如EI和UCB。介绍了贝叶斯调参过程,强调在探索和利用之间的平衡。同时指出,贝叶斯优化需要对统计概率有深入理解,并列举了相关参考资料。
摘要由CSDN通过智能技术生成

1 总述

对于贝叶斯优化,总体可以分为两个部分,概率代理模型和采集函数。

2 概率代理模型和采集函数

概率代理模型:根据模型的参数个数是否固定可分为:参数模型和非参数模型。常见的参数模型有:贝塔-伯努利(Beta-Bernoulli)模型和线性(linear)模型。常见的非参数模型有高斯过程、随机森林等。本文介绍应用范围最广的高斯过程。
采集函数:主要根据后验概率代理模型,选择下一个具有潜力的评估点。

2.1 高斯过程

由于高斯过程的参数维度随着观测点的增加而增加,非固定,因此被归类为非参数模型(并非没有参数)。
高斯过程可以看成是一个函数,这个函数的输入是 x t + 1 x_{t+1} xt+1,函数的输出是在当前输入 x t + 1 x_{t+1} xt+1下的预测值在高斯分布下的均值和方差。

在训练中,主要涉及协方差矩阵的计算和超参数的优化。

2.2 采集函数

采集函数:对于采集函数需要一方面尽可能的探测未知的空间(未评估过的参数组合),这样概率代理模型才能更加接近真实的未知函数。另一方面,根据已经找到的最优值,加大在其周围搜索参数的力度,以期更加迅速的找到全局最优值。这两方面往往是矛盾的,需要在两者之间找到一个平衡点。常见的采集函数有三种:probability of improvenment(PI)、Expected improvement(EI)、Upper confidence bound(UCB)。

3 贝叶斯调参过程

问题简单描述:假设参数有n个,性能为y。贝叶斯初始需要输入一组观测点 { y 1 , X 1 } , { y 2 , X 2 } , { y 3 , X 3 } \mathop \{y_{1},X_{1}\},\{y_{2},X_{2}\},\{y_{3},X_{3}\} { y1,X1},{ y2,X2},{ y3,X3}。其中 X = { x 1 , x 2 , . . . , x n } \mathop X = \{x_{1},x_{2},...,x_{n}\} X={ x1,x2,...,xn}

  1. 更新概率代理模型,首先计算协方差矩阵
    K = [ k ( X 1 , X 1 ) k ( X 1 , X 2 ) k ( X 1 , X 3 ) k ( X 2 , X 1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值