大数据工作流任务调度--有向无环图(DAG)之拓扑排序

本文介绍了拓扑排序的概念,包括图的遍历方法如深度优先搜索(DFS)和广度优先搜索(BFS),并详细阐述了有向无环图(DAG)的拓扑排序过程。通过实例展示了拓扑排序的步骤,强调了拓扑排序在解决依赖问题中的作用。最后,提供了一种基于广度优先遍历的拓扑排序算法实现。
摘要由CSDN通过智能技术生成

拓扑排序(Topological Sorting)

回顾基础知识:

1、图的遍历:
图的遍历是指从图中的某一个顶点出发,按照某种搜索方法沿着图中的边对图中的所有顶点访问一次且仅访问一次。注意树是一种特殊的图,所以树的遍历实际上也可以看作是一种特殊的图的遍历。
2、图的遍历主要有两种算法:广度优先搜索(Breadth First Search,BFS)和深度优先搜索(Depth First Search,DFS)。

  • [1] 深度优先搜索(DFS)
    深度优先搜索的搜索策略是尽可能深地搜索一个图。基本思想是:首先访问图中某一未访问的顶点V1,然后由V1出发,访问与V1邻接且未被访问的任一顶点V2,再访问与V2邻接且未被访问的任一顶点V3,……重复上述过程。当不能再继续向下访问(即孤立点)时,依次退回到最近被访问的顶点,若它还有邻接顶点未被访问过,则从该点开始继续上述搜索过程,直到图中所有顶点均被访问过为止。

  • [2] 广度优先搜索(BFS)
    广度优先搜索的基本思想是:首先访问起始顶点v,接着由v出发,依次访问v的各个未访问过的邻接顶点w1,w2,…,wi,然后再依次访问w1,w2,…,wi的所有未被访问过的邻接顶点;再从这些访问过的顶点出发,再访问它们所有未被访问过的邻接顶点……依次类推,直到图中所有顶点都被访问过为止。
    举例说明:
    在这里插入图片描述
    其BFS遍历如下:1 2 5 3 4 6 7
    其DFS遍历如下:1 2 3 4 5 6 7

接下来说正题:

维基百科上拓扑排序的定义为:

对于任何有向无环图(Directed Acyclic Graph,DAG)而言,其拓扑排序为其所有结点的一个线性排序(同一个有向图可能存在多个这样的结点排序)。该排序满足这样的条件——对于图中的任意两个结点U和V,若存在一条有向边从U指向V,则在拓扑排序中U一定出现在V前面。

通俗来讲:拓扑排序是一个有向无环图(DAG)的所有顶点的线性序列, 该序列必须满足两个条件:

  • 每个顶点出现且只出现一次。
  • 若存在一条从顶点A到顶点B的路径,那么在序列中顶点 A出现在顶点 B的前面。

如何找出它的拓扑排序呢?这里说一种比较常用的方法:

  1. 从DAG图中选择一个入度为0的顶点并输出。
  2. 从图中删除该顶点和所有以它为起点的有向边。
  3. 重复1和2直到当前的DAG图为空或当前图中不存在入度为0的顶点为止。后一种情况说明有向图中必然存在环。
穿插一下:有向图结点的入度(indegree)和出度(outdegree)的概念。
假设有向图中不存在起点和终点为同一结点的有向边。
入度:设有向图中有一结点V,其入度即为当前所有从其他结点出发,终点为V的的边的数目。也就是所有指向V的有向边的数目。
出度:设有向图中有一结点V,其出度即为当前所有起点为V,指向其他结点的边的数目。也就是所有由V发出的边的数目。

例如下面这个DAG图:
DAG图
结点1的入度:0,出度:2
结点2的入度:1,出度:2
结点3的入度:2,出度:1
结点4的入度:2,出度:2
结点5的入度:2,出度:0

它的拓扑排序流程为:
DAG图拓扑排序输出

于是,得到拓扑排序后的结果是: {1,2,4,3,5} 。
如果没有结点2 —> 结点4的这个箭头,那么如下:

我们可以得到它的拓扑排序为:{1,2,4,3,5} 或者 {1,4,2,3,5} ,即对同一DAG图来说,它的拓扑排序结果可能存在多个

拓扑排序主要用来解决有向图中的依赖问题。

在讲到实现的时候,有必要插以下内容:

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值