人工智能第4章超越经典搜索

XXXchunxiXXX

已于 2022-06-07 23:23:21 修改

阅读量708

点赞数 3

分类专栏： -----AI----- 文章标签：人工智能

于 2022-06-07 22:06:47 首次发布

本文链接：https://blog.csdn.net/weixin_42062229/article/details/125167589

版权

-----AI----- 专栏收录该内容

12 篇文章 19 订阅

订阅专栏

本章考虑对一个或多个状态进行评价和修改，而不是系统地搜索从初始状态开始的路径。也就是说，本章注重找到解状态，而忽略初始状态到解的路径。

● 遗传算法是维护大量状态种群的随机爬山搜索。新的状态通过变异和杂交产生，杂交把来自种群的状态对结合在一起。
● 在不确定的环境中，Agent可以应用AND-OR搜索来生成应急规划达成目标，无论执行过程中产生怎样的后果。
● 当环境是部分可观察时，用信念状态表示Agent可能在的状态集合。
● 标准的搜索算法可直接应用于信念状态空进行无感知问题求解，信息状态AND-OR搜索可以解决一般部分可观察问题。在信念状态空间中逐个状态构造解的增量算法通常效率更高。
● 探索问题发生在Agent对环境的状态和行动一无所知时。对于可安全探索的环境，联机搜索 Agent 能够建造地图并且在有解时能够找到目标。根据经验不断修正启发式估计，是一种避免局部极小值的有效方法。

4.1 局部搜索和最优问题

局部搜索算法从单一当前节点出发，通常只移动到它的临近状态。
优点：内存消耗很小，适用于系统算法不适用的很大或无限的状态空间中寻找合理的解。状态空间地形图（见下），坐标（表示状态），高度（表示代价函数或目标函数）。如标高对应代价，最低谷即全局最小值。如标高对应目标函数，最高点即全局最优解。
在这里插入图片描述

爬山算法

首选爬山算法
　　随机寻找该点X的邻近点中首次出现的比点X价值高的点,并将该点作为爬山的点(此处说的价值高,在该题中是指Z或f(x,y)值较大). 依次循环,直至该点的邻近点中不再有比其大的点. 我们成为该点就是山的顶点,又称为最优点. 在后继结点很多时是个好策略。不完备
最陡爬山算法
　　最陡爬山算法是在首选爬山算法上的一种改良,它规定每次选取邻近点价值最大的那个点作为爬上的点。不完备
随机重启爬山算法
　　随机重新开始爬山算法是基于最陡爬山算法,其实就是加一个达到全局最优解的条件,如果满足该条件,就结束运算,反之则无限次重复运算最陡爬山算法.如果每次爬山法搜索成功的概率为p，那么需要重新开始搜索的期望次数为1/p，完备概率接近于1。

模拟退火

模拟退火其实也是一种贪心算法，但是它的搜索过程引入了随机因素。模拟退火算法以一定的概率来接受一个比当前解要差的解，这个概率随着时间推移逐渐降低（逐渐降低才能趋向稳定）因此有可能会跳出这个局部的最优解，达到全局的最优解。

模拟退火算法的优缺点模拟退火算法的应用很广泛，可以高效地求解NP完全问题，如货郎担问题(Travelling Salesman Problem，简记为TSP)、最大截问题(Max Cut Problem)、0-1背包问题(Zero One Knapsack Problem)、图着色问题(Graph Colouring Problem)等等，但其参数难以控制，不能保证一次就收敛到最优值，一般需要多次尝试才能获得（大部分情况下还是会陷入局部最优值）。观察模拟退火算法的过程，发现其主要存在如下三个参数问题：
　　(1) 温度T的初始值设置问题
　　温度T的初始值设置是影响模拟退火算法全局搜索性能的重要因素之一、初始温度高，则搜索到全局最优解的可能性大，但因此要花费大量的计算时间；反之，则可节约计算时间，但全局搜索性能可能受到影响。
　　(2) 退火速度问题，即每个T值的迭代次数
　　模拟退火算法的全局搜索性能也与退火速度密切相关。一般来说，同一温度下的“充分”搜索是相当必要的，但这也需要计算时间。循环次数增加必定带来计算开销的增大。
　　(3) 温度管理问题
　　温度管理问题也是模拟退火算法难以处理的问题之一。实际应用中，由于必须考虑计算复杂度的切实可行性等问题，常采用如下所示的降温方式：
T=α×T.α∈(0,1).
注：为了保证较大的搜索空间，α一般取接近于1的值，如0.95、0.9。

特点：