AutoML 系列 - TPE简介

本文主要对 Tree-structured Parzen Estimator Approach (TPE) 进行介绍

SMBO 算法框架包含一系列优化算法,基本框架如下,而这个框架下的一系列算法的区别主要就在于选取的 surrogate model M M M 以及 评价标准 S S S
在这里插入图片描述
这里介绍一种基于这个框架的优化方法,Tree-structured Parzen Estimator Approach (TPE)

TPE

该方法选择的评价标准 S S S为 Expected Improvement (EI),即 f ( x ) f(x) f(x)会小于某个阈值 y ∗ y^* y的期望。

E I y ∗ ( x ) = ∫ − ∞ ∞ m a x ( y ∗ − y , 0 ) p ( y ∣ x ) d y EI_{y^*}(x)=\int_{-\infty}^{\infty}max(y^*-y,0)p(y|x)dy EIy(x)=max(yy,0)p(yx)dy

TPE 定义如下两个概率密度,

p ( x ∣ y ) = { l ( x ) ,   y < y ∗ g ( x ) ,   y ≥ y ∗ p(x|y)=\left\{ \begin{aligned} l(x), \ y<y^*\\ g(x),\ y \geq y^*\\ \end{aligned} \right. p(xy)={l(x), y<yg(x), yy

l ( x ) l(x) l(x) f ( x i ) f(x^i) f(xi)的值小于 y ∗ y^* y对应的 { x i } \{x^i\} {xi}集合的概率密度; g ( x ) g(x) g(x) f ( x i ) f(x^i) f(xi)的值大于等于 y ∗ y^* y对应的 { x i } \{x^i\} {xi}集合的概率密度。这两个概率密度即为 M M M

那么 y ∗ y^* y如何决定呢?

TPE 采取的方法是,选取在 { y i } \{y^i\} {yi}的一定分位数 γ \gamma γ处的数值作为 y ∗ y^* y,即 p ( y < y ∗ ) = γ p(y<y^*)=\gamma p(y<y)=γ

接下来的问题就在于如何求解上面伪代码中第3行的优化问题了。

因为我们无法直接得知 p ( y ∣ x ) p(y|x) p(yx),所以使用贝叶斯公式进行如下转换,

E I y ∗ ( x ) = ∫ − ∞ ∞ m a x ( y ∗ − y , 0 ) p ( y ∣ x ) d y = ∫ − ∞ y ∗ m a x ( y ∗ − y , 0 ) p ( y ∣ x ) d y = ∫ − ∞ y ∗ m a x ( y ∗ − y , 0 ) p ( x ∣ y ) p ( y ) p ( x ) d y EI_{y^*}(x)=\int_{-\infty}^{\infty}max(y^*-y,0)p(y|x)dy \\ =\int_{-\infty}^{y^*}max(y^*-y,0)p(y|x)dy \\ = \int_{-\infty}^{y^*}max(y^*-y,0)\frac{p(x|y)p(y)}{p(x)}dy EIy(x)=max(yy,0)p(yx)dy=ymax(yy,0)p(yx)dy=ymax(yy,0)p(x)p(xy)p(y)dy

又因为 γ = p ( y < y ∗ ) \gamma = p(y<y^*) γ=p(y<y)并且 p ( x ) = ∫ p ( x ∣ y ) p ( y ) d y = γ l ( x ) + ( 1 − γ ) g ( x ) p(x)=\int p(x|y)p(y)dy=\gamma l(x) + (1-\gamma)g(x) p(x)=p(xy)p(y)dy=γl(x)+(1γ)g(x)

所以
E I y ∗ ( x ) = ∫ − ∞ y ∗ m a x ( y ∗ − y , 0 ) p ( x ∣ y ) p ( y ) p ( x ) d y = ∫ − ∞ y ∗ m a x ( y ∗ − y , 0 ) p ( x ∣ y ) p ( y ) d y p ( x ) = l ( x ) ∗ ∫ − ∞ y ∗ m a x ( y ∗ − y , 0 ) p ( y ) d y p ( x ) = l ( x ) y ∗ γ − l ( x ) ∫ − ∞ y ∗ p ( y ) d y γ l ( x ) + ( 1 − γ ) g ( x ) ∝ ( γ + g ( x ) l ( x ) ( 1 − γ ) ) − 1 EI_{y^*}(x)= \int_{-\infty}^{y^*}max(y^*-y,0)\frac{p(x|y)p(y)}{p(x)}dy \\ = \frac{ \int_{-\infty}^{y^*}max(y^*-y,0)p(x|y)p(y)dy}{p(x)} \\ = \frac{ l(x)*\int_{-\infty}^{y^*}max(y^*-y,0)p(y)dy}{p(x)} \\ = \frac{ l(x)y^*\gamma-l(x)\int_{-\infty}^{y^*}p(y)dy}{\gamma l(x) + (1-\gamma)g(x)} \\ \propto(\gamma+\frac{g(x)}{l(x)}(1-\gamma))^{-1} EIy(x)=ymax(yy,0)p(x)p(xy)p(y)dy=p(x)ymax(yy,0)p(xy)p(y)dy=p(x)l(x)ymax(yy,0)p(y)dy=γl(x)+(1γ)g(x)l(x)yγl(x)yp(y)dy(γ+l(x)g(x)(1γ))1

所以我们可以看出,通过 l ( x ) l(x) l(x)求出概率较高,通过 g ( x ) g(x) g(x)求出概率较小的 x x x,会使 E I EI EI较大。 l ( x ) l(x) l(x) g ( x ) g(x) g(x)tree-structured 的形式表示,会比较方便根据 l ( x ) l(x) l(x)进行采样,并计算 g ( x ) / l ( x ) g(x)/l(x) g(x)/l(x)

上述伪代码在每一轮迭代都返回有最大 E I EI EI x ∗ x^* x

参考资料:《Algorithms for Hyper-Parameter Optimization》

TPE-GP5是一种高频通用实验。高频通用实验是电子学中的一个重要实验,用于研究和理解在高频电路中的各种现象和性质。 TPE-GP5高频通用实验主要涉及以下几个方面: 1. 高频信号发生器:利用高频信号发生器产生不同频率和振幅的信号。通过调节信号发生器的频率和振幅,可以模拟高频电路中的各种信号。 2. 高频信号测量:使用示波器和频谱分析仪等仪器,对高频信号进行测量和分析。通过观测和分析信号的波形、频谱和幅度等特性,可以了解信号在电路中的传播和变化过程。 3. 高频电路特性研究:通过构建和调整高频电路,研究不同电路元件和结构对高频信号的影响。可以通过测量信号的增益、相位差和频率响应等特性,分析电路的性能和特点。 4. 高频滤波器设计:通过设计和调整高频滤波器电路,来实现对特定频率的信号的选择和剔除。可以通过测量实际电路中的滤波器的频率响应和衰减性能,验证滤波器的设计和性能。 TPE-GP5高频通用实验可以帮助学生理解和掌握高频电路的基本原理和技术,培养学生的实验操作能力和创新思维。通过实际操作和数据分析,学生可以对高频电路的特性和性能有更深入的了解,并且掌握相关的实验技巧和方法。同时,高频通用实验也为学生的科学研究和工程实践提供了基础和支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值