旅行商问题与蚁群算法

TomHeaven

已于 2022-10-17 21:46:09 修改

阅读量2.4k

点赞数 7

分类专栏：优化理论文章标签： python 智能优化蚁群算法 TSP 旅行商问题

于 2022-10-17 19:14:31 首次发布

本文链接：https://blog.csdn.net/hanlin_tan/article/details/127372867

版权

优化理论专栏收录该内容

5 篇文章 6 订阅

订阅专栏

文章目录

1 引言

旅行商问题（Traveling Salesman Problem，TSP）是一个经典的组合优化问题：说有一个商品推销员要去若干个城市推销商品，该推销员从一个城市出发，需要经过所有城市后，回到出发地。请问他应如何选择行进路线，以使总的行程最短？

旅行商问题的可行解是所有城市（假设数目为 $n$ ）的全排列（ $n!$ ）。随着城市数目的增加，可行解数目呈现指数增长，无法再多项式时间内穷举，因此TSP问题是一个非确定性多项式（Non-deterministic Polynomial ）问题，也就是“NP”问题。由于较高的时间复杂度，“NP”问题规模较大时无法精确求解，因此只能寻求近似求解。

1997年，Dorigo等人[1]提出蚁群算法（Ant Colony System）并用于求解旅行商问题。蚁群算法受到“蚁群总是能以较短路线觅得食物”这一现象的启发。图1演示了这一过程：(a)中一些蚂蚁达到了分叉路口（一个决策点）；(b)中一些蚂蚁选择了上方的路，另一些选择了下方的路；蚂蚁通常匀速前进并匀速释放信息素（Pheromone，用短虚线表示），©中选择更短路径的蚂蚁可以更快到达目标点，并且在路径上留下更浓密的信息素；(d)中越短的路径上留下了越多的信息素。后来的蚂蚁在路过相同的决策点是，有较大概率选择信息素浓度较高的路径，从而提升整个蚁群的觅食效率。

图1 蚁群行进策略演示

蚁群这这种智能优化方法如何通过形成算法和代码为我们所用呢？这就是本文要解决的问题。

2 方法

蚁群算法的流程是循环执行以下步骤，直到满足退出条件：

初始化蚁群参数。
蚁群中每只蚂蚁搜索一个可行解。
根据一次蚁群搜索的结果更新信息素。
判断是否终止与退出。

下面以求解旅行商问题为例，说明各个步骤。

2.1 初始化蚁群参数

在旅行商问题中，设城市的数量为 $n$ ，城市 $i$ 与 $j$ 之间的距离为 $d_{ij}(i,j=1,2,\cdots,n)$ 。

在蚁群算法中，设蚁群中蚂蚁数量为 $m$ ， $t$ 时刻城市 $i$ 与城市 $j$ 路上的信息素浓度为 $\tau_{ij}(t)$ 。初始时刻 $t = 0$ 时，各个城市之间连接路径上的信息素浓度相同，且为 $\tau_0$ ，也就是 $\tau_{ij}(0)=\tau_0$ 。

2.2 一只蚂蚁搜索可行解（转移概率建模）

蚁群中的蚂蚁 $k(k=1,2,\cdots,m)$ 随机选择一个城市作为出发点，然后依概率随机选择下一个目标城市。设蚂蚁 $k$ 在 $t$ 时刻从城市 $i$ 前往可达城市 $j$ 的转移概率为 $P_{ij}^k(t)$ ，我们按如下思路建模：

根据蚁群的特性，转移概率 $P_{ij}^k(t)$ 应与城市之间的信息素浓度 $\tau_{ij}(t)$ 正相关。这里假设成正比，即

$P_{ij}^k(t) \propto \tau_{ij}(t) \tag{1}$

除了信息素之外，我们对路径选择可能存在已知的偏好（Prior，也称为“先验”或者启发函数），记为 $\eta_{ij}$ ，则转移概率 $P_{ij}^k(t)$ 应与偏好 $\eta_{ij}$ 正相关。例如，可利用已知的城市间距离信息，依据“贪心策略”选择当前距离自己最靠近的城市。可令偏好 $\eta_{ij}$ 为城市之间距离 $d_{ij}$ 的反比，则有

$P_{ij}^k(t) \propto \eta_{ij}=\frac{1}{d_{ij}} \tag{2}$

再考虑概率的归一化特性，可得概率 $P_{ij}^k(t)$ 的计算公式为[2]

$P_{ij}^k = \left\{ \begin{aligned} \frac{\tau_{ij}(t)^\alpha \cdot \eta_{ij}(t)^\beta}{\Sigma_{s \in allow_k} \tau_{is}(t)^\alpha \cdot \eta_{is}(t)^\beta},& s \in allow_k \\ 0,& s \notin allow_k \end{aligned} \right. \tag{3}$

其中 $allow_k(k=1,2,3,\cdots,m)$ 为蚂蚁待访问的城市集合。常数参数 $\alpha$ 为信息素重要度因子， $\beta$ 为偏好重要度因子，分别用于调节信息素和偏好在转移概率中所起的作用大小。当 $\alpha=0$ ，转移概率完全由偏好决定，算法退化为贪心算法；当 $\beta=0$ ，转移概率完全由信息素决定，算法就成了正反馈启发式算法。

2.3 更新信息素

经过 $n$ 个时刻，蚁群中的蚂蚁走完所有城市，每只蚂蚁所走过的路径就是一个解。此时，需要对信息素进行一次更新，以便下一次循环中蚁群利用新的信息素进行决策——选择每一步转移的城市。

注意在蚂蚁释放信息素的同时，各个城市间连接路径上的信息素也会随时间（循环优化的次数）逐渐消失。设参数 $\rho \in (0, 1)$ 表示信息素挥发的速度，则信息素的更新公式如公式(4)所示：

$\left\{ \begin{aligned} \tau_{ij}(t+1) &= (1-\rho)\tau_{ij}(t) + \Delta \tau_{ij} \\ \Delta \tau_{ij} &= \sum_{k=1}^m \Delta \tau_{ij}^k \end{aligned} \right. \tag{4}$

其中 $\Delta \tau_{ij}$ 表示蚁群中所有蚂蚁在城市 $i$ 与城市 $j$ 连接路径上释放的信息素浓度之和； $\Delta \tau_{ij}^k$ 表示第 $k$ 只蚂蚁在城市 $i$ 与城市 $j$ 连接路径上释放的信息素浓度。蚂蚁走过路径总长度越小，则释放的信息素越大。据此可以对蚂蚁 $k$ 的信息素变化建立一个简单的反比模型，如公式(5)所示：

$\Delta \tau_{ij}^k = \left\{ \begin{aligned} \frac{Q}{L_k}，& \text{第}k\text{只蚂蚁从城市}i\text{访问城市}j \\ 0，& \text{其他} \end{aligned} \right. \tag{5}$
其中 $Q$ 为常数，表示蚂蚁循环一次所释放的信息素总量； $L_k$ 为第 $k$ 只蚂蚁经过的路径总长度。

2.4 判断终止与退出

通常，蚁群算法设定有最大循环搜索次数，达到最大循环次数，则算法退出。

3 Python代码实现

落难Coder的知乎中对于蚁群算法求解TSP问题有一个很好的实现，本文直接引用：

# -*- coding: utf-8 -*-
import random
import copy
import time
import sys
import math
import tkinter #//GUI模块
import threading
from functools import reduce


# 参数
'''
ALPHA:信息启发因子，值越大，则蚂蚁选择之前走过的路径可能性就越大
      ，值越小，则蚁群搜索范围就会减少，容易陷入局部最优
BETA:Beta值越大，蚁群越就容易选择局部较短路径，这时算法收敛速度会
     加快，但是随机性不高，容易得到局部的相对最优
'''
(ALPHA, BETA, RHO, Q) = (1.0,2.0,0.5,100.0)
# 城市数，蚁群
(city_num, ant_num) = (50,50)
distance_x = [
    178,272,176,171,650,499,267,703,408,437,491,74,532,
    416,626,42,271,359,163,508,229,576,147,560,35,714,
    757,517,64,314,675,690,391,628,87,240,705,699,258,
    428,614,36,360,482,666,597,209,201,492,294]
distance_y = [
    170,395,198,151,242,556,57,401,305,421,267,105,525,
    381,244,330,395,169,141,380,153,442,528,329,232,48,
    498,265,343,120,165,50,433,63,491,275,348,222,288,
    490,213,524,244,114,104,552,70,425,227,331]
#城市距离和信息素
distance_graph = [ [0.0 for col in range(city_num)] for raw in range(city_num)]
pheromone_graph = [ [1.0 for col in range(city_num)] for raw in range(city_num)]



#----------- 蚂蚁 -----------
class Ant(object):

    # 初始化
    def __init__(self,ID):

        self.ID = ID                 # ID
        self.__clean_data()          # 随机初始化出生点

    # 初始数据
    def __clean_data(self):

        self.path = []               # 当前蚂蚁的路径           
        self.total_distance = 0.0    # 当前路径的总距离
        self.move_count = 0          # 移动次数
        self.current_city = -1       # 当前停留的城市
        self.open_table_city = [True for i in range(city_num)] # 探索城市的状态

        city_index = random.randint(0,city_num-1) # 随机初始出生点
        self.current_city = city_index
        self.path.append(city_index)
        self.open_table_city[city_index] = False
        self.move_count = 1

    # 选择下一个城市
    def __choice_next_city(self):

        next_city = -1
        select_citys_prob = [0.0 for i in range(city_num)]  #存储去下个城市的概率
        total_prob = 0.0

        # 获取去下一个城市的概率
        for i in range(city_num):
            if self.open_table_city[i]:
                try :
                    # 计算概率：与信息素浓度成正比，与距离成反比
                    select_citys_prob[i] = pow(pheromone_graph[self.current_city][i], ALPHA) * pow((1.0/distance_graph[self.current_city][i]), BETA)
                    total_prob += select_citys_prob[i]
                except ZeroDivisionError as e:
                    print ('Ant ID: {ID}, current city: {current}, target city: {target}'.format(ID = self.ID, current = self.current_city, target = i))
                    sys.exit(1)

        # 轮盘选择城市
        if total_prob > 0.0:
            # 产生一个随机概率,0.0-total_prob
            temp_prob = random.uniform(0.0, total_prob)
            for i in range(city_num):
                if self.open_table_city[i]:
                    # 轮次相减
                    temp_prob -= select_citys_prob[i]
                    if temp_prob < 0.0:
                        next_city = i
                        break

        # 未从概率产生，顺序选择一个未访问城市
        # if next_city == -1:
        #     for i in range(city_num):
        #         if self.open_table_city[i]:
        #             next_city = i
        #             break

        if (next_city == -1):
            next_city = random.randint(0, city_num - 1)
            while ((self.open_table_city[next_city]) == False):  # if==False,说明已经遍历过了
                next_city = random.randint(0, city_num - 1)

        # 返回下一个城市序号
        return next_city

    # 计算路径总距离
    def __cal_total_distance(self):

        temp_distance = 0.0

        for i in range(1, city_num):
            start, end = self.path[i], self.path[i-1]
            temp_distance += distance_graph[start][end]

        # 回路
        end = self.path[0]
        temp_distance += distance_graph[start][end]
        self.total_distance = temp_distance


    # 移动操作
    def __move(self, next_city):

        self.path.append(next_city)
        self.open_table_city[next_city] = False
        self.total_distance += distance_graph[self.current_city][next_city]
        self.current_city = next_city
        self.move_count += 1

    # 搜索路径
    def search_path(self):

        # 初始化数据
        self.__clean_data()

        # 搜素路径，遍历完所有城市为止
        while self.move_count < city_num:
            # 移动到下一个城市
            next_city =  self.__choice_next_city()
            self.__move(next_city)

        # 计算路径总长度
        self.__cal_total_distance()

#----------- TSP问题 -----------

class TSP(object):

    def __init__(self, root, width = 800, height = 600, n = city_num):

        # 创建画布
        self.root = root                               
        self.width = width      
        self.height = height
        # 城市数目初始化为city_num
        self.n = n
        # tkinter.Canvas
        self.canvas = tkinter.Canvas(
                root,
                width = self.width,
                height = self.height,
                bg = "#EBEBEB",             # 背景白色 
                xscrollincrement = 1,
                yscrollincrement = 1
            )
        self.canvas.pack(expand = tkinter.YES, fill = tkinter.BOTH)
        self.title("TSP蚁群算法(n:初始化 e:开始搜索 s:停止搜索 q:退出程序)")
        self.__r = 5
        self.__lock = threading.RLock()     # 线程锁

        self.__bindEvents()
        self.new()

        # 计算城市之间的距离
        for i in range(city_num):
            for j in range(city_num):
                temp_distance = pow((distance_x[i] - distance_x[j]), 2) + pow((distance_y[i] - distance_y[j]), 2)
                temp_distance = pow(temp_distance, 0.5)
                distance_graph[i][j] =float(int(temp_distance + 0.5))

    # 按键响应程序
    def __bindEvents(self):

        self.root.bind("q", self.quite)        # 退出程序
        self.root.bind("n", self.new)          # 初始化
        self.root.bind("e", self.search_path)  # 开始搜索
        self.root.bind("s", self.stop)         # 停止搜索

    # 更改标题
    def title(self, s):

        self.root.title(s)

    # 初始化
    def new(self, evt = None):

        # 停止线程
        self.__lock.acquire()
        self.__running = False
        self.__lock.release()

        self.clear()     # 清除信息 
        self.nodes = []  # 节点坐标
        self.nodes2 = [] # 节点对象

        # 初始化城市节点
        for i in range(len(distance_x)):
            # 在画布上随机初始坐标
            x = distance_x[i]
            y = distance_y[i]
            self.nodes.append((x, y))
            # 生成节点椭圆，半径为self.__r
            node = self.canvas.create_oval(x - self.__r,
                    y - self.__r, x + self.__r, y + self.__r,
                    fill = "#ff0000",      # 填充红色
                    outline = "#000000",   # 轮廓白色
                    tags = "node",
                )
            self.nodes2.append(node)
            # 显示坐标
            self.canvas.create_text(x,y-10,              # 使用create_text方法在坐标（302，77）处绘制文字
                    text = '('+str(x)+','+str(y)+')',    # 所绘制文字的内容
                    fill = 'black'                       # 所绘制文字的颜色为灰色
                )

        # 顺序连接城市
        #self.line(range(city_num))

        # 初始城市之间的距离和信息素
        for i in range(city_num):
            for j in range(city_num):
                pheromone_graph[i][j] = 1.0

        self.ants = [Ant(ID) for ID in range(ant_num)]  # 初始蚁群
        self.best_ant = Ant(-1)                          # 初始最优解
        self.best_ant.total_distance = 1 << 31           # 初始最大距离
        self.iter = 1                                    # 初始化迭代次数 

    # 将节点按order顺序连线
    def line(self, order):
        # 删除原线
        self.canvas.delete("line")
        def line2(i1, i2):
            p1, p2 = self.nodes[i1], self.nodes[i2]
            self.canvas.create_line(p1, p2, fill = "#000000", tags = "line")
            return i2

        # order[-1]为初始值
        reduce(line2, order, order[-1])

    # 清除画布
    def clear(self):
        for item in self.canvas.find_all():
            self.canvas.delete(item)

    # 退出程序
    def quite(self, evt):
        self.__lock.acquire()
        self.__running = False
        self.__lock.release()
        self.root.destroy()
        print (u"\n程序已退出...")
        sys.exit()

    # 停止搜索
    def stop(self, evt):
        self.__lock.acquire()
        self.__running = False
        self.__lock.release()

    # 开始搜索
    def search_path(self, evt = None):

        # 开启线程
        self.__lock.acquire()
        self.__running = True
        self.__lock.release()

        while self.__running:
            # 遍历每一只蚂蚁
            for ant in self.ants:
                # 搜索一条路径
                ant.search_path()
                # 与当前最优蚂蚁比较
                if ant.total_distance < self.best_ant.total_distance:
                    # 更新最优解
                    self.best_ant = copy.deepcopy(ant)
            # 更新信息素
            self.__update_pheromone_gragh()
            print (u"迭代次数：",self.iter,u"最佳路径总距离：",int(self.best_ant.total_distance))
            # 连线
            self.line(self.best_ant.path)
            # 设置标题
            self.title("TSP蚁群算法(n:随机初始 e:开始搜索 s:停止搜索 q:退出程序) 迭代次数: %d" % self.iter)
            # 更新画布
            self.canvas.update()
            self.iter += 1

    # 更新信息素
    def __update_pheromone_gragh(self):

        # 获取每只蚂蚁在其路径上留下的信息素
        temp_pheromone = [[0.0 for col in range(city_num)] for raw in range(city_num)]
        for ant in self.ants:
            for i in range(1,city_num):
                start, end = ant.path[i-1], ant.path[i]
                # 在路径上的每两个相邻城市间留下信息素，与路径总距离反比
                temp_pheromone[start][end] += Q / ant.total_distance
                temp_pheromone[end][start] = temp_pheromone[start][end]

        # 更新所有城市之间的信息素，旧信息素衰减加上新迭代信息素
        for i in range(city_num):
            for j in range(city_num):
                pheromone_graph[i][j] = pheromone_graph[i][j] * RHO + temp_pheromone[i][j]

    # 主循环
    def mainloop(self):
        self.root.mainloop()

#----------- 程序的入口处 -----------![请添加图片描述](https://img-blog.csdnimg.cn/cffb2f0918614eb28c8c50b1bb5a9c2f.png)

if __name__ == '__main__':
    TSP(tkinter.Tk()).mainloop()

将上面的代码写入tsp.py文件，然后从命令行运行

python3 tsp.py

即可直观感受蚁群算法迭代优化旅行商问题的过程。

参考文献与致谢

[1] Dorigo, Marco, and Luca Maria Gambardella. “Ant colony system: a cooperative learning approach to the traveling salesman problem.” IEEE Transactions on evolutionary computation 1, no. 1 (1997): 53-66.

[2] 老马的程序人生

[3] 落难Coder的知乎

最后，让我们膜拜大神，感谢Dorigo等人为我们带来了蚁群算法。

图2 Marco Dorigo（蚁群算法论文的一作）

TomHeaven

关注

7
点赞
踩
45

收藏

觉得还不错? 一键收藏
打赏
2
评论
旅行商问题与蚁群算法

旅行商问题（Traveling Salesman Problem，TSP）是一个经典的组合优化问题：说有一个商品推销员要去若干个城市推销商品，该推销员从一个城市出发，需要经过所有城市后，回到出发地。请问他应如何选择行进路线，以使总的行程最短？
复制链接

扫一扫