使用优化算法搜索正确的决策

优化算法

可以通过搜索用于评估决策的选项来做出自动决策。

优化算法搜索选项列表,并使用目标条件选择控制操作。 在本单元中,我们将探讨几种类型的优化方法。

暴力搜索优化

优化算法就像探险家在地球表面寻找最高的山峰。 确保找到最高峰的一种方法是踏上陆地的每平方米,在每个点进行测量,测量完成后,按照海拔高度对测量结果进行排序。 地球上的最高点现在将位于列表的顶部。

由于地球上有 5.1 亿平方公里的土地,这需要很多生存期才能得到答案。 此方法称为暴力搜索,仅当潜在决策的地理搜索区域较小时才可行。 对于更复杂的地理区域或状态空间,我们需要其他方法,如以下部分所述。

基于梯度的优化

寻找地球最高峰的更有效方法是在陆地上行走,只沿向上倾斜最多的方向行走。 使用此方法,你只需朝上坡方向行走即可避免探索大部分地理区域。 在优化中,此类方法称为基于梯度的方法,因为山的斜度称为坡度或梯度。

此方法存在两个挑战。 第一个挑战是,根据你开始搜索探索的位置,你可能会到达一座不是地球最高点(也称为局部最高点)的高山。

此方法的第二个限制是,它只能在可以计算所走地面的斜度的情况下使用。 如果地形中存在间隙(考虑垂直落差或无底坑),则无法计算垂直落差处的斜度(技术上是无限的),因此无法使用基于梯度的优化方法在该空间中搜索解决方案。

上图显示了基于梯度的方法陷入局部最大值的挑战。

多方面优化

现在,假设你将雇佣多个探险家从布局的不同地方出发,寻找最高点。 在每一步之后,探险家都会比较他们目前的海拔高度和提升高度,并利用他们的综合知识更好地绘制地球地图。 这可能会导致搜索速度更快,并避免所有探险家被困在一个不是山峰的高处。 珠穆朗玛峰。 然而,仍然无法保证向全球最高值的趋同。

Illustration of multi-faceted optimization.

上图是多方面优化的示例。

其他优化方法

其中许多算法的灵感来源于自然过程。 大自然有许多有效的方法可以彻底探索,就像水流过一片土地。 以下是一些示例:

  • 进化算法的灵感来源于达尔文的自然选择理论。 进化算法产生了一个潜在的解决方案决策群体,测试群体中的每个解决方案如何实现过程目标,终止无效的解决方案,然后转变群体以继续探索。
  • 群方法的灵感来源于蚂蚁、蜜蜂和粒子的蜂拥、移动和交互方式。 这些优化方法与许多探索家一起探索解决方案空间,这些探索家沿着布局移动,并就他们找到的内容相互交流。
  • 树方法将潜在解决方案视为树上的分支。 想象一下,“选择你自己的冒险”小说(以及其他互动小说)要求你在故事的某个时刻决定要往哪个方向走。 决策随每个决策点的选项数而激增。 基于树的方法使用各种技术来有效地搜索树(不必访问每个分支)以寻找解决方案。 一些更著名的树方法是分支定界和 Monte Carlo 树搜索 (MCTS)。
  • 模拟退火的灵感来源于金属在加热后冷却的方式。 所有金属都有一个晶体结构,以一种常见的方式冷却。 这种结构在金属温度较高时变化较大,而温度较低时变化较小。 退火是一种工艺,将金属等材料加热到其再结晶温度以上,然后缓慢冷却以使其在各种工业过程的下一步中更具延展性。 此算法模拟该过程。 模拟退火在一段时间内使用不同的搜索行为来搜索空间。 模拟退火首先投射出一个广泛的搜索网(探索更多),当它知道更多时,就会集中在发现的最有前景的领域,随着时间的推移探索减少。

优化算法的优点和缺点

优化算法不假定对问题有任何了解,因此,当我们对状态空间一无所知并且我们想要探索时,最好使用优化算法。

它们的主要缺点是耗时,除非状态空间较小,否则我们可能没有足够的时间找到最佳决策。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值