蚁群算法详解

最新推荐文章于 2025-03-22 13:18:30 发布

sunshinecxm_BJTU

最新推荐文章于 2025-03-22 13:18:30 发布

阅读量1.7w

点赞数 25

分类专栏：智能算法_车辆车辆路径问题文章标签：算法机器学习概率论

原文链接：https://blog.csdn.net/qq_38048756/article/details/109383971

版权

智能算法_车辆车辆路径问题专栏收录该内容

18 篇文章

订阅专栏

蚁群算法详解（含例程）

蚁群算法详解

1.算法简介

1991年意大利米兰理学院M. Dorigo提出Ant System, 用于求解TSP等组合优化问题，这是一种模拟蚂蚁觅食行为的优化算法。

蚂蚁在运动过程中, 能够在它所经过的路径上留下外激素,而且蚂蚁在运动过程中能够感知外激素的存在及其强度,并以此指导自己的运动方向, 蚂蚁倾向于朝着外激素强度高的方向移动.由大量蚂蚁组成的蚁群的集体行为便表现出一种信息正反馈现象: 某一路径上走过的蚂蚁越多,则后来者选择该路径的概率就越大. 蚂蚁个体之间就是通过这种信息的交流达到搜索食物的目的。

举一个例子来进行说明：
在这里插入图片描述
蚂蚁从A点出发，速度相同，食物在D点，可能随机选择路线ABD或ACD。假设初始时每条分配路线一只蚂蚁，每个时间单位行走一步，本图为经过9个时间单位时的情形：走ABD的蚂蚁到达终点，而走ACD的蚂蚁刚好走到C点，为一半路程。

经过18个时间单位时的情形：走ABD的蚂蚁到达终点后得到食物又返回了起点A，而走ACD的蚂蚁刚好走到D点。
在这里插入图片描述
假设蚂蚁每经过一处所留下的信息素为一个单位，则经过36个时间单位后，所有开始一起出发的蚂蚁都经过不同路径从D点取得了食物，此时ABD的路线往返了2趟，每一处的信息素为4个单位，而ACD的路线往返了一趟，每一处的信息素为2个单位，其比值为2：1
寻找食物的过程继续进行，则按信息素的指导，蚁群在ABD路线上增派一只蚂蚁（共2只），而ACD路线上仍然为一只蚂蚁。再经过36个时间单位后，两条线路上的信息素单位积累为12和4，比值为3：1。
若按以上规则继续，蚁群在ABD路线上再增派一只蚂蚁（共3只），而ACD路线上仍然为一只蚂蚁。再经过36个时间单位后，两条线路上的信息素单位积累为24和6，比值为4：1。
若继续进行，则按信息素的指导，最终所有的蚂蚁会放弃ACD路线，而都选择ABD路线。这也就是前面所提到的正反馈效应。

基于以上蚁群寻找食物时的最优路径选择问题，可以构造人工蚁群，来解决最优化问题，如TSP问题。

人工蚁群和自然蚁群的区别：

人工蚁群有一定的记忆能力，能够记忆已经访问过的节点；
人工蚁群选择下一条路径的时候是按一定算法规律有意识地寻找最短路径，而不是盲目的。例如在TSP问题中，可以预先知道当前城市到下一个目的地的距离。

2.Ant System(蚂蚁系统)

蚂蚁系统是以TSP作为应用实例提出的，是最基本的ACO（Ant Colony algorithm）算法，下面以AS求解TSP问题的基本流程为例描述蚁群优化算法的工作机制

首先对于TSP问题的数学模型如下：
在这里插入图片描述
AS算法求解TSP问题有两大步骤：路径构建与信息素更新方式。

2.1 路径构建

每个蚂蚁都随机选择一个城市作为其出发城市，并维护一个路径记忆向量，用来存放该蚂蚁依次经过的城市。蚂蚁在构建路径的每一步中，按照一个随机比例规则选择下一个要到达的城市。

随机比例规则如下：
在这里插入图片描述

2.2 信息素更新

在这里插入图片描述
此处的 $C^ {nn}$ 表示最短路径的长度。

为了模拟蚂蚁在较短路径上留下更多的信息素，当所有蚂蚁到达终点时，必须把各路径的信息素浓度重新更新一次，信息素的更新也分为两个部分：

首先，每一轮过后，问题空间中的所有路径上的信息素都会发生蒸发
然后，所有的蚂蚁根据自己构建的路径长度在它们本轮经过的边上释放信息素

在这里插入图片描述

信息素挥发（evaporation） 信息素痕迹的挥发过程是每个连接上的信息素痕迹的浓度自动逐渐减弱的过程，这个挥发过程主要用于避免算法过快地向局部最优区域集中，有助于搜索区域的扩展。

信息素增强（reinforcement） 增强过程是蚁群优化算法中可选的部分，称为离线更新方式（还有在线更新方式）。这种方式可以实现由单个蚂蚁无法实现的集中行动。基本蚁群算法的离线更新方式是在蚁群中的m只蚂蚁全部完成n城市的访问后，统一对残留信息进行更新处理。

下面以一个例子进行说明：

在这里插入图片描述
其中矩阵D表示各城市间的距离

一般蚁群算法的框架和上述算法大致相同，有三个组成部分：蚁群的活动；信息素的挥发；信息素的增强；主要体现在转移概率公式和信息素更新公式的不同。

3. 改进的蚁群算法

上述基本的AS算法，在不大于75城市的TSP中，结果还是较为理想的，但是当问题规模扩展时， AS的解题能力大幅度下降。进而提出了一些改进版本的AS算法，这些AS改进版本的一个共同点就是增强了蚂蚁搜索过程中对最优解的探索能力，它们之间的差异仅在于搜索控制策略方面。

3.1 精英策略的蚂蚁系统(Elitist Ant System, EAS)

AS算法中，蚂蚁在其爬过的边上释放与其构建路径长度成反比的信息素量，蚂蚁构建的路径越好，则属于路径的各个边上的所获得的信息素量就越多，这些边以后在迭代中被蚂蚁选择的概率也就越大。
我们可以想象，当城市的规模较大时，问题的复杂度呈指数级增长，仅仅靠这样一个基础单一的信息素更新机制引导搜索偏向，搜索效率有瓶颈。

因而精英策略(Elitist Strategy) 被提出，这是一种较早的改进方法，通过一种“额外的手段”强化某些最有可能成为最优路径的边，让蚂蚁的搜索范围更快、更正确的收敛。
在算法开始后即对所有已发现的最好路径给予额外的增强，并将随后与之对应的行程记为Tb(全局最优行程)；
当进行信息素更新时，对这些行程予以加权，同时将经过这些行程的蚂蚁记为“精英”，从而增大较好行程的选择机会。

其信息素的更新方式如下：
在这里插入图片描述

3.2 基于排列的蚂蚁系统(Rank-based AS, ASrank )

精英策略被提出后，人们提出了在精英策略的基础上，对其余边的信息素更新机制加以改善
在这里插入图片描述

3.3 最大最小蚂蚁系统(MAX-MIN Ant System, MMAS)

首先思考几个问题：
问题一：对于大规模的TSP，由于搜索蚂蚁的个数有限，而初始化时蚂蚁的分布是随机的，这会不会造成蚂蚁只搜索了所有路径中的小部分就以为找到了最好的路径，所有的蚂蚁都很快聚集在同一路径上，而真正优秀的路径并没有被搜索到呢？

问题二：当所有蚂蚁都重复构建着同一条路径的时候，意味着算法的已经进入停滞状态。此时不论是基本AS、EAS还是ASrank ，之后的迭代过程都不再可能有更优的路径出现。这些算法收敛的效果虽然是“单纯而快速的”，但我们都懂得欲速而不达的道理，我们有没有办法利用算法停滞后的迭代过程进一步搜索以保证找到更接近真实目标的解呢？

对于MAX-MIN Ant System

该算法修改了AS的信息素更新方式，只允许迭代最优蚂蚁（在本次迭代构建出最短路径的蚂蚁），或者至今最优蚂蚁释放信息素；
路径上的信息素浓度被限制在[MAX，MIN ]范围内；
另外，信息素的初始值被设为其取值上限，这样有助于增加算法初始阶段的搜索能力。
为了避免搜索停滞，问题空间内所有边上的信息素都会被重新初始化。

改进1借鉴于精华蚂蚁系统，但又有细微的不同。

在EAS中，只允许至今最优的蚂蚁释放信息素，而在MMAS中，释放信息素的不仅有可能是至今最优蚂蚁，还有可能是迭代最优蚂蚁。
实际上，迭代最优更新规则和至今最优更新规则在MMAS中是交替使用的。
这两种规则使用的相对频率将会影响算法的搜索效果。
只使用至今最优更新规则进行信息素的更新，搜索的导向性很强，算法会很快的收敛到Tb附近；反之，如果只使用迭代最优更新规则，则算法的探索能力会得到增强，但搜索效率会下降。

改进2是为了避免某些边上的信息素浓度增长过快，出现算法早熟现象。