关键路径
拓扑排序主要是为解决一个工程能否顺序进行的问题,但有时我们还需要解决工程完成需要的最短时间问题。比如造一辆汽车,我们需要先造各种各样零件、部件,最终再组装成车,假如,造一个轮子需要0.5天时间,造一个发动机需要3天时间,造一个车底盘需要2天时间,造一个外壳需要2天时间,其他零部件时间需要2天,全部零部件集中到一处需要0.5天,组装成车需要2天,问汽车厂造辆车,最短需要多少时间呢?
一定不是时间的全部和。因此我们如果要对一个流程图获得最短时间,就必须要分析它们的拓扑关系,并且找到当中最关键的流程,这个流程的时间就是最短时间。
因此在AOV网的基础上,我们来提出一个概念:
在一个表示工程的带权有向图中,用顶点表示事件,用有向边表示活动,用边上的权表示活动的持续时间,这种有向图的边表示活动的网,我们称之为AOE网(Activity On Edge Network)。我们把AOE网中没有入边的的顶点称为始点或源点,没有出边的顶点称为终点或汇点。由于一个工程,总有一个开始,一个结束,所以正常情况下,AOE网只有一个源点一个汇点。如下图
v9是汇点,v0是源点。v1~v9分别表示事件,弧<v0,v1>,<v0,v2>,…<v8,v9>都表示一个活动,用a0,a1,…a12表示,它们的值代表着活动持续的时间,比如弧<v0,v1>就是从源点开始的第一个活动a0,它的时间是3个单位。
既然AOE网表示工程流程,所以它就具有明显的工程特性。如有在某顶点所代表的事发生生,从该顶点出发的各活动才能开始。只有在进入某顶点的各活动都结束,该顶点所代表的事件才能发生。
尽管AOE与AOV网都是用来对工程建模的,但它们还是有很大的不同,主要体现在AOV网是顶点表示活动的网,它只描述活动之间的制约关系,而AOE网是用边表示活动的网,边上的权值表示活动持续的时间,因此,AOE网是要建立在活动之间制约关系没有矛盾的基础上,再来分析完成整个工程至少需要多少时间,或者为缩短完成工程所需要时间,应当加快哪些活动等问题。
我们把路径上各个活动所持续的时间之和称为路径长度,从源点到汇点具有最大长度的路径叫关键路径,在关键路径上的活动叫关键活动。
最早开始时间与最晚开始时间不等,说明有空闲时间。也就是说,我们只需要找到所有活动的最早开始时间和最晚开始时间,并且比较它们,如果相等就意味着此活动是关键活动,活动间的路径为关键路径。如果不等就不是。为此有如下几个参数
1. 事件的最早发生时间evt(earliest time of vertex):即顶点vk的最早发生时间
2. 事件的最晚发生时间ltv(latest time of vertex):即顶点vk的最晚发生时间,超出此时间将会延误工期。
3. 活动的最早开工时间ete(earliest time of edge):即弧ak的最早发生时间
4. 活动的最晚开工时间lte(latest time of edge):即弧ak的最晚发生时间,也就是不推迟工期的最晚开工时间。
我们是由1和2可以求得3和4,然后再根据ete[k]是否与lte[k]相等来判断ak是否是关键活动。
关键路径算法
我们将上面的AOE网转化为邻接表结构,注意增加了weight域,用来存储弧的权值
求事件 的最早发生时间etv的过程,就是我们从头至尾找拓扑序列的过程,因此,在求关键路径之前,需要先调用一次拓扑序列算法来计算etv和拓扑序列列表。为此我们首先在程序开始处声明几个全局变量。
int *etv,*ltv;//事件最早发生时间和最迟发生时间数组
int *stack2;//用于存储拓扑序列的栈
int top2; //用于stack2的指针
//下面是改进过的求拓扑序列算法
status TopologicalSort(GraphAdjList GL)
{
EdgeNode *e;
int i,k,gettop;
int top=0; //用于栈指针下标
int count=0; //用于统计输出顶点的个数
int *stack; //创栈将入度为0的顶点入栈
stack=(int *)malloc(GL->numVertexes*sizeof(int));
for(i=0;i<GL->numVertexes;i++)
if(0==GL->adjList[i].in) stack[++top]=i;
top2=0;
etv=(int *)malloc(GL-numVertexes*sizeof(int)); //事件最早发生时间
for(i=0;i<GL->numVertexes;i++)
etv[i] = 0;
stack2=(int *)malloc(GL->numVertexes*sizeof(int));
while(top!=0)
{
gettop = stack[top--];
count++;
stack2[++top2] = gettop; //将弹出的顶点序号压入拓扑序列的栈
for(e=GL->adjList[gettop].firstedge;e;e=e->next)
{
k=e->adjvex;
if(!(--GL->adjList[k].in))
stack[++top]=k;
if((etv[gettop]+e->weight)>etv[k])
etv[k]=etv[gettop]+e->weight;
}
}
if(count<GL->numVertexes)
return ERROR;
else
return OK;
}
代码中,除了加粗部分外,与前面讲的拓扑排序算法没有什么不同,第11~15行为初始化全局变量etv数组、top2和stack2的过程。第21行就是将本是要输出的拓扑序列压入全局栈stack2中。第27~28行很关键,它是求etv数组的每一个元素的值。比如说,假如我们已经求得顶点v0对应的etv[0]=0,顶点v1对应的etv[1]=3,顶点v2对应的etv[2]=4,现在我们需要求顶点v3对应的etv[3],其实就是求etv[1]+len<v1,v3>与etv[2]+len<v2,v3>的较大值。显然3+5<4+8,得到etv[3]=12。如图所示,在代码中e->weight就是当前弧的长度。
由此我们也可以得出计算顶点vk即求etv[k]的最早发生时间公式是:
下面我们来看一下求关键路径的算法代码
void CriticalPath(GraphAdjList GL)
{
EdgeNode *e;
int i,gettop,k,j;
int ete,lte;
TopologicalSort(GL); //求拓扑序列,计算数组etv和stack2的值
ltv=(int *)malloc(GL->numVertexes*sizeof(int));//事件最晚发生时间
for(i=0;i<GL->numVertexes;i++)
ltv[i] =etv[GL->numVertexes-1];//初始化ltv
while(top2!=0)
{
gettop = stack2[top2-1];
for(e=GL->adjList[gettop].firstedge;e;e=e->next)
{//求各顶点事件的最迟发生时间ltv值
k=e->adjvex;
if(ltv[k]-e->weight<ltv[gettop])//各点事件最晚发生时间
ltv[gettop] =ltv[k]-e->weight;
}
for(j=0;j<GL->numVertexes;j++)
{
for(e=GL->adjList[j].firstedge;e;e=e->next)
{
k=e->adjvex;
ete = etv[j];
lte =ltv[k]-e->weight;
if(ete==lte)
printf(“<v%d,v%d>length:%d,”,GL->adjList[j].data,GL->adjList[k].data,e->weight);
}
}
}
}
1. 程序开始执行。第5行,声明了ete和lte两个活动最早最晚发生时间变量。
2. 第6行,调用求拓扑序列的函数。执行完毕后,全局变量数组etv和栈stack值。top2=10。也就是说,对于每个事件的最早发生时间,我们已经计算出来了
3. 第7~9行为初始化全局变量ltv数组,因为etv[9]=27,所以数组ltv当前的值为:{27, 27, 27,27, 27, 27, 27, 27, 27}
4. 第10~19行为计算ltv的循环。第12行,先将stack2的栈头出栈,由后进先出得到gettop = 0。根据邻接表中,v9没有弧表,所以第13~18行循环体未执行。
5. 再次来到第12行,gettop=8,第13~18行的循环中,v8的弧表只有一条<v8,v9>,第15行得到k=9,因为ltv[9]-3<ltv[8],所以ltv[8]=ltv[9]-3=24,
6. 再次循环,当gettop=7、5、6时,同理可算出ltv相对应的值19、13、25,此时ltv值为{27,27,27,27,27,13,25,19,24,27}
7. 当gettop=4时,由邻接表可得到v4有两条弧<v4,v6>,<v4,v7>,通常第13~18行的循环,可以得到ltv[4]=min(ltv[7]-4,ltv[6]-9)=min(19-4,25-9)
此时你应该发现,我们在计算ltv时,其实是把拓扑序倒过来进行的。因此我们可以得出计算顶点vk即求ltv[k]的最晚发生时间的公式是:
就这样,当程序执行到第20行时,相关变量的值如图
相关变量的值上表,如果单位是天的话,比如etv=[1]而ltv[7],表示的意思就是如果时间单位是天的话,哪怕v1这个事件在第7天才开始,也可以保证整个工程的按期完成,你可以提前v1事件开始时间,但你最早也只能在第3三天开始。
8. 第20~31行是来求另两个变量活动最早开始时间ete和活动最晚开始时间lte,并对相同下标的它们做比较。两重循环嵌套是对邻接表的顶点和每个顶点的弧表遍历
9. 当j=0时,从v0点开始,有<v0,v2>和<v0,v1>两条弧。当k=2时,ete=etv[j]=etv[0]。lte=ltv[v]-e->weight=ltv[2]-len<v0,v2>=4-4=0,此时ete=lte,表示弧<v0,v2>是关键的活动,因此打印。当k=1时,ete=etv[j]=etv[0]=0。lte=ltv[k]-e->weight=ltv[1]-len<v0,v1>=7-3=4,此时ete≠lte。因此<v0,v1>并不是关键活动
这里需要解释一下,ete本来是表示活动<vk,vj>的最早开工时间,是针对弧来说的。但是只有此弧尾顶点vk的事件发生了,它才可以开始,因此ete=etv[k]
而lte表示的是活动<vk,vj>的最晚开工时间,但此活动再晚也不能等于vj事件发生才开始,而必须要在vj事件之前发生,所以lte=ltv[j]-len<vk,vj>。
比如晚上23点睡觉,你不能说到23点才开始做作业,而必须要提前2小时,在21点开始,才有可能按时完成作业。
所以最终,其实就是判断ete与lte是否相等,相等意味着活动没有任何空闲,是关键活动,否则就不是。
10. j=1一直到j=9为止,做法完全相同的,关键路径打印结果<v0,v2>4,<v2,v3>8<v3,v4>3,<v4,v7>4,<v7,v8>5,<v8,v9>3,最终关键路径为如下图