旅行商问题与蚁群算法

1 引言

旅行商问题(Traveling Salesman Problem,TSP)是一个经典的组合优化问题:说有一个商品推销员要去若干个城市推销商品,该推销员从一个城市出发,需要经过所有城市后,回到出发地。请问他应如何选择行进路线,以使总的行程最短?

旅行商问题的可行解是所有城市(假设数目为 n n n)的全排列( n ! n! n!)。随着城市数目的增加,可行解数目呈现指数增长,无法再多项式时间内穷举,因此TSP问题是一个非确定性多项式(Non-deterministic Polynomial )问题,也就是“NP”问题。由于较高的时间复杂度,“NP”问题规模较大时无法精确求解,因此只能寻求近似求解。

1997年,Dorigo等人[1]提出蚁群算法(Ant Colony System)并用于求解旅行商问题。蚁群算法受到“蚁群总是能以较短路线觅得食物”这一现象的启发。图1演示了这一过程:(a)中一些蚂蚁达到了分叉路口(一个决策点);(b)中一些蚂蚁选择了上方的路,另一些选择了下方的路;蚂蚁通常匀速前进并匀速释放信息素(Pheromone,用短虚线表示),©中选择更短路径的蚂蚁可以更快到达目标点,并且在路径上留下更浓密的信息素;(d)中越短的路径上留下了越多的信息素。后来的蚂蚁在路过相同的决策点是,有较大概率选择信息素浓度较高的路径,从而提升整个蚁群的觅食效率。
蚁群行进策略演示
图1 蚁群行进策略演示

蚁群这这种智能优化方法如何通过形成算法和代码为我们所用呢?这就是本文要解决的问题。

2 方法

蚁群算法的流程是循环执行以下步骤,直到满足退出条件:

  • 初始化蚁群参数。
  • 蚁群中每只蚂蚁搜索一个可行解。
  • 根据一次蚁群搜索的结果更新信息素。
  • 判断是否终止与退出。

下面以求解旅行商问题为例,说明各个步骤。

2.1 初始化蚁群参数

在旅行商问题中,设城市的数量为 n n n,城市 i i i j j j之间的距离为 d i j ( i , j = 1 , 2 , ⋯   , n ) d_{ij}(i,j=1,2,\cdots,n) dij(i,j=1,2,,n)

在蚁群算法中,设蚁群中蚂蚁数量为 m m m t t t时刻城市 i i i与城市 j j j路上的信息素浓度为 τ i j ( t ) \tau_{ij}(t) τij(t)。初始时刻 t = 0 t=0 t=0时,各个城市之间连接路径上的信息素浓度相同,且为 τ 0 \tau_0 τ0,也就是 τ i j ( 0 ) = τ 0 \tau_{ij}(0)=\tau_0 τij(0)=τ0

2.2 一只蚂蚁搜索可行解(转移概率建模)

蚁群中的蚂蚁 k ( k = 1 , 2 , ⋯   , m ) k(k=1,2,\cdots,m) k(k=1,2,,m)随机选择一个城市作为出发点,然后依概率随机选择下一个目标城市。设蚂蚁 k k k t t t时刻从城市 i i i前往可达城市 j j j的转移概率为 P i j k ( t ) P_{ij}^k(t) Pijk(t),我们按如下思路建模:

  • 根据蚁群的特性,转移概率 P i j k ( t ) P_{ij}^k(t) Pijk(t)应与城市之间的信息素浓度 τ i j ( t ) \tau_{ij}(t) τij(t)正相关。这里假设成正比,即

P i j k ( t ) ∝ τ i j ( t ) (1) P_{ij}^k(t) \propto \tau_{ij}(t) \tag{1} Pijk(t)τij(t)(1)

  • 除了信息素之外,我们对路径选择可能存在已知的偏好(Prior,也称为“先验”或者启发函数),记为 η i j \eta_{ij} ηij,则转移概率 P i j k ( t ) P_{ij}^k(t) Pijk(t)应与偏好 η i j \eta_{ij} ηij正相关。 例如,可利用已知的城市间距离信息,依据“贪心策略”选择当前距离自己最靠近的城市。可令偏好 η i j \eta_{ij} ηij为城市之间距离 d i j d_{ij} dij的反比, 则有

P i j k ( t ) ∝ η i j = 1 d i j (2) P_{ij}^k(t) \propto \eta_{ij}=\frac{1}{d_{ij}} \tag{2} Pijk(t)ηij=dij1(2)

再考虑概率的归一化特性,可得概率 P i j k ( t ) P_{ij}^k(t) Pijk(t)的计算公式为[2]

P i j k = { τ i j ( t ) α ⋅ η i j ( t ) β Σ s ∈ a l l o w k τ i s ( t ) α ⋅ η i s ( t ) β , s ∈ a l l o w k 0 , s ∉ a l l o w k (3) P_{ij}^k = \left\{ \begin{aligned} \frac{\tau_{ij}(t)^\alpha \cdot \eta_{ij}(t)^\beta}{\Sigma_{s \in allow_k} \tau_{is}(t)^\alpha \cdot \eta_{is}(t)^\beta},& s \in allow_k \\ 0,& s \notin allow_k \end{aligned} \right. \tag{3} Pijk= Σsallowkτis(t)αηis(t)βτij(t)αηij(t)β,0,sallowks/allowk(3)

其中 a l l o w k ( k = 1 , 2 , 3 , ⋯   , m ) allow_k(k=1,2,3,\cdots,m) allowk(k=1,2,3,,m)为蚂蚁待访问的城市集合。常数参数 α \alpha α为信息素重要度因子, β \beta β为偏好重要度因子,分别用于调节信息素和偏好在转移概率中所起的作用大小。当 α = 0 \alpha=0 α=0,转移概率完全由偏好决定,算法退化为贪心算法;当 β = 0 \beta=0 β=0,转移概率完全由信息素决定,算法就成了正反馈启发式算法。

2.3 更新信息素

经过 n n n个时刻,蚁群中的蚂蚁走完所有城市,每只蚂蚁所走过的路径就是一个解。此时,需要对信息素进行一次更新,以便下一次循环中蚁群利用新的信息素进行决策——选择每一步转移的城市。

注意在蚂蚁释放信息素的同时,各个城市间连接路径上的信息素也会随时间(循环优化的次数)逐渐消失。设参数 ρ ∈ ( 0 , 1 ) \rho \in (0, 1) ρ(0,1)表示信息素挥发的速度,则信息素的更新公式如公式(4)所示:

{ τ i j ( t + 1 ) = ( 1 − ρ ) τ i j ( t ) + Δ τ i j Δ τ i j = ∑ k = 1 m Δ τ i j k (4) \left\{ \begin{aligned} \tau_{ij}(t+1) &= (1-\rho)\tau_{ij}(t) + \Delta \tau_{ij} \\ \Delta \tau_{ij} &= \sum_{k=1}^m \Delta \tau_{ij}^k \end{aligned} \right. \tag{4} τij(t+1)Δτij=(1ρ)τij(t)+Δτij=k=1mΔτijk(4)

其中 Δ τ i j \Delta \tau_{ij} Δτij表示蚁群中所有蚂蚁在城市 i i i与城市 j j j连接路径上释放的信息素浓度之和; Δ τ i j k \Delta \tau_{ij}^k Δτijk表示第 k k k只蚂蚁在城市 i i i与城市 j j j连接路径上释放的信息素浓度。蚂蚁走过路径总长度越小,则释放的信息素越大。据此可以对蚂蚁 k k k的信息素变化建立一个简单的反比模型,如公式(5)所示:

Δ τ i j k = { Q L k , 第 k 只蚂蚁从城市 i 访问城市 j 0 , 其他 (5) \Delta \tau_{ij}^k = \left\{ \begin{aligned} \frac{Q}{L_k},& \text{第}k\text{只蚂蚁从城市}i\text{访问城市}j \\ 0,& \text{其他} \end{aligned} \right. \tag{5} Δτijk= LkQ0k只蚂蚁从城市i访问城市j其他(5)
其中 Q Q Q为常数,表示蚂蚁循环一次所释放的信息素总量; L k L_k Lk为第 k k k只蚂蚁经过的路径总长度。

2.4 判断终止与退出

通常,蚁群算法设定有最大循环搜索次数,达到最大循环次数,则算法退出。

3 Python代码实现

落难Coder的知乎中对于蚁群算法求解TSP问题有一个很好的实现,本文直接引用:

# -*- coding: utf-8 -*-
import random
import copy
import time
import sys
import math
import tkinter #//GUI模块
import threading
from functools import reduce


# 参数
'''
ALPHA:信息启发因子,值越大,则蚂蚁选择之前走过的路径可能性就越大
      ,值越小,则蚁群搜索范围就会减少,容易陷入局部最优
BETA:Beta值越大,蚁群越就容易选择局部较短路径,这时算法收敛速度会
     加快,但是随机性不高,容易得到局部的相对最优
'''
(ALPHA, BETA, RHO, Q) = (1.0,2.0,0.5,100.0)
# 城市数,蚁群
(city_num, ant_num) = (50,50)
distance_x = [
    178,272,176,171,650,499,267,703,408,437,491,74,532,
    416,626,42,271,359,163,508,229,576,147,560,35,714,
    757,517,64,314,675,690,391,628,87,240,705,699,258,
    428,614,36,360,482,666,597,209,201,492,294]
distance_y = [
    170,395,198,151,242,556,57,401,305,421,267,105,525,
    381,244,330,395,169,141,380,153,442,528,329,232,48,
    498,265,343,120,165,50,433,63,491,275,348,222,288,
    490,213,524,244,114,104,552,70,425,227,331]
#城市距离和信息素
distance_graph = [ [0.0 for col in range(city_num)] for raw in range(city_num)]
pheromone_graph = [ [1.0 for col in range(city_num)] for raw in range(city_num)]



#----------- 蚂蚁 -----------
class Ant(object):

    # 初始化
    def __init__(self,ID):

        self.ID = ID                 # ID
        self.__clean_data()          # 随机初始化出生点

    # 初始数据
    def __clean_data(self):

        self.path = []               # 当前蚂蚁的路径           
        self.total_distance = 0.0    # 当前路径的总距离
        self.move_count = 0          # 移动次数
        self.current_city = -1       # 当前停留的城市
        self.open_table_city = [True for i in range(city_num)] # 探索城市的状态

        city_index = random.randint(0,city_num-1) # 随机初始出生点
        self.current_city = city_index
        self.path.append(city_index)
        self.open_table_city[city_index] = False
        self.move_count = 1

    # 选择下一个城市
    def __choice_next_city(self):

        next_city = -1
        select_citys_prob = [0.0 for i in range(city_num)]  #存储去下个城市的概率
        total_prob = 0.0

        # 获取去下一个城市的概率
        for i in range(city_num):
            if self.open_table_city[i]:
                try :
                    # 计算概率:与信息素浓度成正比,与距离成反比
                    select_citys_prob[i] = pow(pheromone_graph[self.current_city][i], ALPHA) * pow((1.0/distance_graph[self.current_city][i]), BETA)
                    total_prob += select_citys_prob[i]
                except ZeroDivisionError as e:
                    print ('Ant ID: {ID}, current city: {current}, target city: {target}'.format(ID = self.ID, current = self.current_city, target = i))
                    sys.exit(1)

        # 轮盘选择城市
        if total_prob > 0.0:
            # 产生一个随机概率,0.0-total_prob
            temp_prob = random.uniform(0.0, total_prob)
            for i in range(city_num):
                if self.open_table_city[i]:
                    # 轮次相减
                    temp_prob -= select_citys_prob[i]
                    if temp_prob < 0.0:
                        next_city = i
                        break

        # 未从概率产生,顺序选择一个未访问城市
        # if next_city == -1:
        #     for i in range(city_num):
        #         if self.open_table_city[i]:
        #             next_city = i
        #             break

        if (next_city == -1):
            next_city = random.randint(0, city_num - 1)
            while ((self.open_table_city[next_city]) == False):  # if==False,说明已经遍历过了
                next_city = random.randint(0, city_num - 1)

        # 返回下一个城市序号
        return next_city

    # 计算路径总距离
    def __cal_total_distance(self):

        temp_distance = 0.0

        for i in range(1, city_num):
            start, end = self.path[i], self.path[i-1]
            temp_distance += distance_graph[start][end]

        # 回路
        end = self.path[0]
        temp_distance += distance_graph[start][end]
        self.total_distance = temp_distance


    # 移动操作
    def __move(self, next_city):

        self.path.append(next_city)
        self.open_table_city[next_city] = False
        self.total_distance += distance_graph[self.current_city][next_city]
        self.current_city = next_city
        self.move_count += 1

    # 搜索路径
    def search_path(self):

        # 初始化数据
        self.__clean_data()

        # 搜素路径,遍历完所有城市为止
        while self.move_count < city_num:
            # 移动到下一个城市
            next_city =  self.__choice_next_city()
            self.__move(next_city)

        # 计算路径总长度
        self.__cal_total_distance()

#----------- TSP问题 -----------

class TSP(object):

    def __init__(self, root, width = 800, height = 600, n = city_num):

        # 创建画布
        self.root = root                               
        self.width = width      
        self.height = height
        # 城市数目初始化为city_num
        self.n = n
        # tkinter.Canvas
        self.canvas = tkinter.Canvas(
                root,
                width = self.width,
                height = self.height,
                bg = "#EBEBEB",             # 背景白色 
                xscrollincrement = 1,
                yscrollincrement = 1
            )
        self.canvas.pack(expand = tkinter.YES, fill = tkinter.BOTH)
        self.title("TSP蚁群算法(n:初始化 e:开始搜索 s:停止搜索 q:退出程序)")
        self.__r = 5
        self.__lock = threading.RLock()     # 线程锁

        self.__bindEvents()
        self.new()

        # 计算城市之间的距离
        for i in range(city_num):
            for j in range(city_num):
                temp_distance = pow((distance_x[i] - distance_x[j]), 2) + pow((distance_y[i] - distance_y[j]), 2)
                temp_distance = pow(temp_distance, 0.5)
                distance_graph[i][j] =float(int(temp_distance + 0.5))

    # 按键响应程序
    def __bindEvents(self):

        self.root.bind("q", self.quite)        # 退出程序
        self.root.bind("n", self.new)          # 初始化
        self.root.bind("e", self.search_path)  # 开始搜索
        self.root.bind("s", self.stop)         # 停止搜索

    # 更改标题
    def title(self, s):

        self.root.title(s)

    # 初始化
    def new(self, evt = None):

        # 停止线程
        self.__lock.acquire()
        self.__running = False
        self.__lock.release()

        self.clear()     # 清除信息 
        self.nodes = []  # 节点坐标
        self.nodes2 = [] # 节点对象

        # 初始化城市节点
        for i in range(len(distance_x)):
            # 在画布上随机初始坐标
            x = distance_x[i]
            y = distance_y[i]
            self.nodes.append((x, y))
            # 生成节点椭圆,半径为self.__r
            node = self.canvas.create_oval(x - self.__r,
                    y - self.__r, x + self.__r, y + self.__r,
                    fill = "#ff0000",      # 填充红色
                    outline = "#000000",   # 轮廓白色
                    tags = "node",
                )
            self.nodes2.append(node)
            # 显示坐标
            self.canvas.create_text(x,y-10,              # 使用create_text方法在坐标(302,77)处绘制文字
                    text = '('+str(x)+','+str(y)+')',    # 所绘制文字的内容
                    fill = 'black'                       # 所绘制文字的颜色为灰色
                )

        # 顺序连接城市
        #self.line(range(city_num))

        # 初始城市之间的距离和信息素
        for i in range(city_num):
            for j in range(city_num):
                pheromone_graph[i][j] = 1.0

        self.ants = [Ant(ID) for ID in range(ant_num)]  # 初始蚁群
        self.best_ant = Ant(-1)                          # 初始最优解
        self.best_ant.total_distance = 1 << 31           # 初始最大距离
        self.iter = 1                                    # 初始化迭代次数 

    # 将节点按order顺序连线
    def line(self, order):
        # 删除原线
        self.canvas.delete("line")
        def line2(i1, i2):
            p1, p2 = self.nodes[i1], self.nodes[i2]
            self.canvas.create_line(p1, p2, fill = "#000000", tags = "line")
            return i2

        # order[-1]为初始值
        reduce(line2, order, order[-1])

    # 清除画布
    def clear(self):
        for item in self.canvas.find_all():
            self.canvas.delete(item)

    # 退出程序
    def quite(self, evt):
        self.__lock.acquire()
        self.__running = False
        self.__lock.release()
        self.root.destroy()
        print (u"\n程序已退出...")
        sys.exit()

    # 停止搜索
    def stop(self, evt):
        self.__lock.acquire()
        self.__running = False
        self.__lock.release()

    # 开始搜索
    def search_path(self, evt = None):

        # 开启线程
        self.__lock.acquire()
        self.__running = True
        self.__lock.release()

        while self.__running:
            # 遍历每一只蚂蚁
            for ant in self.ants:
                # 搜索一条路径
                ant.search_path()
                # 与当前最优蚂蚁比较
                if ant.total_distance < self.best_ant.total_distance:
                    # 更新最优解
                    self.best_ant = copy.deepcopy(ant)
            # 更新信息素
            self.__update_pheromone_gragh()
            print (u"迭代次数:",self.iter,u"最佳路径总距离:",int(self.best_ant.total_distance))
            # 连线
            self.line(self.best_ant.path)
            # 设置标题
            self.title("TSP蚁群算法(n:随机初始 e:开始搜索 s:停止搜索 q:退出程序) 迭代次数: %d" % self.iter)
            # 更新画布
            self.canvas.update()
            self.iter += 1

    # 更新信息素
    def __update_pheromone_gragh(self):

        # 获取每只蚂蚁在其路径上留下的信息素
        temp_pheromone = [[0.0 for col in range(city_num)] for raw in range(city_num)]
        for ant in self.ants:
            for i in range(1,city_num):
                start, end = ant.path[i-1], ant.path[i]
                # 在路径上的每两个相邻城市间留下信息素,与路径总距离反比
                temp_pheromone[start][end] += Q / ant.total_distance
                temp_pheromone[end][start] = temp_pheromone[start][end]

        # 更新所有城市之间的信息素,旧信息素衰减加上新迭代信息素
        for i in range(city_num):
            for j in range(city_num):
                pheromone_graph[i][j] = pheromone_graph[i][j] * RHO + temp_pheromone[i][j]

    # 主循环
    def mainloop(self):
        self.root.mainloop()

#----------- 程序的入口处 -----------![请添加图片描述](https://img-blog.csdnimg.cn/cffb2f0918614eb28c8c50b1bb5a9c2f.png)

if __name__ == '__main__':
    TSP(tkinter.Tk()).mainloop()

将上面的代码写入tsp.py文件,然后从命令行运行

python3 tsp.py

即可直观感受蚁群算法迭代优化旅行商问题的过程。

参考文献与致谢

[1] Dorigo, Marco, and Luca Maria Gambardella. “Ant colony system: a cooperative learning approach to the traveling salesman problem.” IEEE Transactions on evolutionary computation 1, no. 1 (1997): 53-66.

[2] 老马的程序人生

[3] 落难Coder的知乎

最后,让我们膜拜大神,感谢Dorigo等人为我们带来了蚁群算法。

Marco Dorigo
图2 Marco Dorigo(蚁群算法论文的一作)

  • 7
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
旅行商问题(Traveling Salesman Problem,TSP)是一个经典的组合优化问题,目标是找到一条最短路径,使得旅行商能够访问所有城市并回到起始城市。遗传算法是一种启发式优化算法,常被用于解决TSP问题。 在Java中实现旅行商问题的遗传算法,可以按照以下步骤进行: 1. 定义城市和距离:首先需要定义城市的坐标和城市之间的距离。可以使用二维数组或者城市对象来表示。 2. 初始化种群:创建一个初始的种群,每个个体代表一条路径。可以使用随机生成的方式或者其他启发式方法来生成初始种群。 3. 适应度函数:定义一个适应度函数来评估每个个体的路径长度。在TSP问题中,适应度函数即为路径的总长度。 4. 选择操作:使用选择算子(如轮盘赌选择、锦标赛选择等)从种群中选择一部分个体作为父代。 5. 交叉操作:对选出的父代进行交叉操作,生成新的子代。可以使用交叉点交叉、顺序交叉等方式进行交叉操作。 6. 变异操作:对子代进行变异操作,引入一定的随机性。可以通过交换、插入、反转等方式对路径进行变异。 7. 更新种群:将父代和子代合并,更新种群。 8. 重复步骤4-7,直到达到终止条件(如达到最大迭代次数或找到最优解)。 9. 输出结果:输出找到的最优路径和路径长度。 以上是旅行商问题遗传算法的基本步骤。在实际实现中,还可以根据需要进行优化和改进,如引入局部搜索、精英保留策略等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

TomHeaven

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值