Black Box Optimization学习笔记

本页面解释了黑箱成本函数优化的进化策略的实现。
在这种情况下,黑盒意味着不能对代价函数做任何假设,例如,我们不能得到它的导数,我们甚至不知道它是否是连续的。
已经实现的进化策略都是基于**奖励加权平均(又名概率加权平均)**的,正如本文/演示中所解释的:http://icml.cc/discuss/2012/171.html
这里有一个1页的算法描述: http://www.pyoudeyer.com/stulpOudeyerDevelopmentalScience17.pdf#page=30
基本算法如下:

x_mu = ??; x_Sigma = ?? // Initialize multi-variate Gaussian distribution 初始化多变量高斯分布
while (!halt_condition) {
	// Explore
	for k=1:K {
		x[k] ~ N(x_mu,x_Sigma) // Sample from Gaussian 高斯样本
		costs[k] = costfunction(x[k]) // Evaluate sample 评估样品
	}
	// Update distribution 更新分布
	weights = costs2weights(costs) // Should assign higher weights to lower costs 是否应该赋予较低成本更高的权重
	x_mu_new = weightsT * x; // Compute weighted mean of samples计算样本的加权平均值
	x_covar_new = (weights .* x)T * weights // Compute weighted covariance matrix of samples计算样本加权协方差矩阵
	x_mu = x_mu_new
	x_covar = x_covar_new
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值