使用omp并行技术加速最短路径算法-迪杰斯特拉(Dijkstra)算法(记录最短路径和距离)

原理:

Dijkstra算法是解决**单源最短路径**问题的**贪心算法**

它先求出长度最短的一条路径,再参照该最短路径求出长度次短的一条路径

    直到求出从源点到其他各个顶点的最短路径。

首先假定源点为u,顶点集合V被划分为两部分:集合 S 和 V-S。 初始时S中仅含有源点u,其中S中的顶点到源点的最短路径已经确定。

集合S 和V-S中所包含的顶点到源点的最短路径的长度待定,称从源点出发只经过S中的点到达V-S中的点的路径为特殊路径,

并用dist[]记录当前每个顶点对应的最短特殊路径长度。

选择特殊路径长度最短的路径,将其连接的V-S中的顶点加入到集合S中,同时更新数组dist[]。一旦S包含了所有顶点,dist[]就是从源到所有其他顶点的最短路径长度。

(1)数据结构。 设置地图的带权邻接矩阵为map[][],即如果从源点u到顶点i有边,就令map[u][i]=<u,i>的权值,否则map[u][i]=∞;

              采用一维数组dist[i]来记录从源点到i顶点的最短路径长度:采用一维数组p[i]来记录最短路径上i顶点的前驱。

(2)初始化。令集合S={u},对于集合V-S中的所有顶点x,初始化dist[i]=map[u][i],如果源点u到顶点i有边相连,初始化p[i]=u(i的前驱是u),否则p[i]=-1

(3)找最小。在集合V-S中依照贪心策略来寻找使得dist[j]具有最小值的顶点t,即dist[t]=min,则顶点t就是集合V-S中距离源点u最近的顶点。

(4)加入S战队。将顶点t加入集合S,同时更新V-S

(5)判结束。如果集合V-S为空,算法结束,否则转6

(6)借东风。在(3)中已近找到了源点到t的最短路径,那么对集合V-S中所有与顶点t相邻的顶点j,都可以借助t走捷径。

            如果dist[j]>dist[t]+map[t][j],则dist[j]=dist[t]+map[t][j],记录顶点j的前驱为t,p[j]=t,转(3)。

            //我自己在这里理解就是,从u找到与它最近的点t,在从t找到与它最近的点j,在....按照这样持续下去,直到最后一个点

    这里我再通俗的解释下这个借东风的意思。

    源点为1,如果我们找到了距离源点最近的点2,且点2与3,4相连。

        这样,我们如果要倒3,4有两种方法:

                1->2->3(4)

                1->3(4)

        这里我们就要判断是从1直接到3(4)快,还是经过2后快。假设<1,2>=2 / <2,3>=3 / <1,3>=4

            根据上面的数据,我们第一次找最小找到的是2结点,如果我们直接把2替换掉1当做源点继续找下一个最近的点,这种方法是错的。

            因为可以看出1->3只用4,而过2的话要用5。

实现代码如下:

#include<bits/stdc++.h>
#include<omp.h>
#include<time.h>
using namespace std;//1899 20296
const int N=2000;	//城市个数可修改
const int INF=1e7;	//初始化无穷大为.......
int G[N][N],dist[N],p[N],n,m;	//n为城市个数,m为城市间路线的条数
bool flag[N];	//如果flag[i]=true,说明该顶点i已经加入到集合S;否则i属于集合V-S
//#pragma omp parallel for

void Dijkstra(int u){
    #pragma omp parallel for
	for(int i=1;i<=n;i++){//********>>>--1--<<<******//
        
		dist[i]=G[u][i];	//初始化源点u到其他各个顶点的最短路径长度
		flag[i]=false;
		if(dist[i]==INF)
			p[i]=-1;	//说明源点u到顶点i无边相连,设置p[i]=-1
		else
			p[i]=u;	//说明源点u到顶点i有边相连,设置p[i]=u
	}
	flag[u]=true;//初始化集合S中,只有一个元素:源点u
	dist[u]=0;	//初始化源点u的最短路径为0,自己到自己的最短路径




   
	for(int i=1;i<=n;i++){//********>>>--2--<<<******//
		int temp=INF,t=u;

        #pragma omp parallel for
		for(int j=1;j<=n;j++){//>>--3--<<在集合V-S中寻找距离源点u最近的顶点t
			if(!flag[j] && dist[j]<temp){
				t=j;	//记录距离源点u最近的顶点
				temp=dist[j];
			}
		}

		if(t==u) return ;	//找不到t跳出循环
		flag[t]=true;	//否则,将t加入集合S

        #pragma omp parallel for
		for(int j=1;j<=n;j++){//>>--4--<<更新集合V-S中与t邻接的顶点到u的距离
			if(!flag[j] && G[t][j]<INF){//!flag[j]表示j在v-s集合中,map[t][j]<INF表示t与j邻接
				if(dist[j]>(dist[t]+G[t][j])){//经过t到达j的路径更短
					dist[j]=dist[t]+G[t][j];
					p[j]=t;	//记录j的前驱为t
				}
			}
		}	
	}	
}


void findpath(int u)
{
	int x;
	stack<int>s;
	cout << "源点为:" << u << endl;
	for (int i = 1; i <= n; i++)
	{
		x = p[i];
		while (x != -1)
		{
			s.push(x);
			x = p[x];
		}
		cout << "源点到其他各顶点的最短路径为:";
		while (!s.empty())
		{
			cout << s.top() << "--";
			s.pop();
		}
		cout << i << ";最短距离为:" << dist[i] << endl;
	}
}



int main(int argc, char *argv[]){
	int u, v, w, start;
    int number = atoi(argv[1]);   //线程数
    ifstream fin("input.txt");

    fin >> n >> m;
    for(int i=1;i<=n;i++)//初始化图的邻接矩阵
		for (int j = 1; j <= n; j++)
		{
			G[i][j] = INF;//初始化邻接矩阵为无穷大
		}
    while(fin>>u >> v >> w)
    {
        G[u][v] = min(G[u][v], w);	//邻接矩阵存储,保留最小的距离
    }

	cout << "请输所在的位置:" << endl;
	cin>>start;
	double st, ed;
    omp_set_num_threads(number);   //设置线程数
    st = omp_get_wtime();
	Dijkstra(start);
	ed = omp_get_wtime();
	findpath(start);
	cout << "Time: " << ed-st<< "s" << endl;
	return 0;
}

使用 #pragma omp parallel for进行加速:

编译:g++ ./filename.cpp -o ./filename -fopenmp

运行: ./filename n  n表示线程数

运行结果:

数据长这样:

 也可以用这一组数据来测试:

6 9
0 1 7
0 2 9
0 5 14
1 2 10
1 3 15
2 3 11
2 5 2
3 4 6
4 5 9

 数据集下载提取码:k3v2

OpenMP基本概念
OpenMP是一种用于共享内存并行系统的多线程程序设计方案,支持的编程语言包括C、C++和Fortran。OpenMP提供了对并行算法的高层抽象描述,特别适合在多核CPU机器上的并行程序设计。编译器根据程序中添加的pragma指令,自动将程序并行处理,使用OpenMP降低了并行编程的难度和复杂度。当编译器不支持OpenMP时,程序会退化成普通(串行)程序。程序中已有的OpenMP指令不会影响程序的正常编译运行。

在VS中启用OpenMP很简单,很多主流的编译环境都内置了OpenMP。在项目上右键->属性->配置属性->C/C++->语言->OpenMP支持,选择“是”即可。

OpenMP执行模式
OpenMP采用fork-join的执行模式。开始的时候只存在一个主线程,当需要进行并行计算的时候,派生出若干个分支线程来执行并行任务。当并行代码执行完成之后,分支线程会合,并把控制流程交给单独的主线程。

一个典型的fork-join执行模型的示意图如下:

OpenMP编程模型以线程为基础,通过编译制导指令制导并行化,有三种编程要素可以实现并行化控制,他们分别是编译制导、API函数集和环境变量。

编译制导
编译制导指令以#pragma omp 开始,后边跟具体的功能指令,格式如:#pragma omp 指令[子句[,子句] …]。常用的功能指令如下:

parallel:用在一个结构块之前,表示这段代码将被多个线程并行执行;
for:用于for循环语句之前,表示将循环计算任务分配到多个线程中并行执行,以实现任务分担,必须由编程人员自己保证每次循环之间无数据相关性;
parallel for:parallel和for指令的结合,也是用在for循环语句之前,表示for循环体的代码将被多个线程并行执行,它同时具有并行域的产生和任务分担两个功能;
sections:用在可被并行执行的代码段之前,用于实现多个结构块语句的任务分担,可并行执行的代码段各自用section指令标出(注意区分sections和section);
parallel sections:parallel和sections两个语句的结合,类似于parallel for;
single:用在并行域内,表示一段只被单个线程执行的代码;
critical:用在一段代码临界区之前,保证每次只有一个OpenMP线程进入;
flush:保证各个OpenMP线程的数据影像的一致性;
barrier:用于并行域内代码的线程同步,线程执行到barrier时要停下等待,直到所有线程都执行到barrier时才继续往下执行;
atomic:用于指定一个数据操作需要原子性地完成;
master:用于指定一段代码由主线程执行;
threadprivate:用于指定一个或多个变量是线程专用,后面会解释线程专有和私有的区别。
相应的OpenMP子句为: 


private:指定一个或多个变量在每个线程中都有它自己的私有副本;
firstprivate:指定一个或多个变量在每个线程都有它自己的私有副本,并且私有变量要在进入并行域或任务分担域时,继承主线程中的同名变量的值作为初值;
lastprivate:是用来指定将线程中的一个或多个私有变量的值在并行处理结束后复制到主线程中的同名变量中,负责拷贝的线程是for或sections任务分担中的最后一个线程; 
reduction:用来指定一个或多个变量是私有的,并且在并行处理结束后这些变量要执行指定的归约运算,并将结果返回给主线程同名变量;
nowait:指出并发线程可以忽略其他制导指令暗含的路障同步;
num_threads:指定并行域内的线程的数目; 
schedule:指定for任务分担中的任务分配调度类型;
shared:指定一个或多个变量为多个线程间的共享变量;
ordered:用来指定for任务分担域内指定代码段需要按照串行循环次序执行;
copyprivate:配合single指令,将指定线程的专有变量广播到并行域内其他线程的同名变量中;
copyin:用来指定一个threadprivate类型的变量需要用主线程同名变量进行初始化;
default:用来指定并行域内的变量的使用方式,缺省是shared。
利用omp_set_num_threads()来设置线程数,

利用#pragma omp parallel sections 声明下面大括号中的语句要并行多线程执行;

利用#pragma omp section 分配线程。

看懂下列helloworld的代码对openmp并行就会有一定了解。

 
 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我可以为您解答这个问题。首先,Dijkstra算法是一种贪心算法,用于解决单源最路径问题(SSSP),即给定一个带权有向图G和源节点s,找出从s到G中所有其他节点的最路径。下面是使用Dijkstra算法实现SSSP问题的步骤: 1. 初始化:将除源节点s以外的所有节点的最距离dist[i]赋值为无穷大,将源节点s的最距离dist[s]赋值为0。 2. 遍历:重复执行下列操作,直到所有节点的最路径都被确定: a. 选择一个未确定最路径的节点u,使得dist[u]最小。 b. 确定节点u的最路径。 c. 对于节点u的每个邻居节点v,更新其最距离dist[v],如果dist[u]+w(u,v)<dist[v],则更新dist[v]=dist[u]+w(u,v)。 3. 输出:输出各个节点到源节点s的最距离dist[i]。 下面是使用C++和OpenMP优化实现Dijkstra算法解决SSSP问题的代码: ```c++ #include <iostream> #include <fstream> #include <vector> #include <queue> #include <limits> #include <chrono> #include <omp.h> using namespace std; const int MAXN = 100000; const int INF = numeric_limits<int>::max(); int n, m, s; vector<pair<int, int>> adj[MAXN+1]; int dist[MAXN+1]; bool visited[MAXN+1]; void dijkstra() { fill(dist, dist+n+1, INF); fill(visited, visited+n+1, false); dist[s] = 0; priority_queue<pair<int, int>, vector<pair<int, int>>, greater<pair<int, int>>> pq; pq.push(make_pair(0, s)); while (!pq.empty()) { int u = pq.top().second; pq.pop(); if (visited[u]) continue; visited[u] = true; #pragma omp parallel for for (int i = 0; i < adj[u].size(); i++) { int v = adj[u][i].first; int w = adj[u][i].second; if (dist[u] + w < dist[v]) { dist[v] = dist[u] + w; pq.push(make_pair(dist[v], v)); } } } } int main() { ifstream fin("input.txt"); fin >> n >> m >> s; for (int i = 0; i < m; i++) { int u, v, w; fin >> u >> v >> w; adj[u].push_back(make_pair(v, w)); } fin.close(); auto start = chrono::high_resolution_clock::now(); dijkstra(); auto end = chrono::high_resolution_clock::now(); auto duration = chrono::duration_cast<chrono::microseconds>(end - start); cout << "Time taken by function: " << duration.count() << " microseconds" << endl; ofstream fout("output.txt"); for (int i = 1; i <= n; i++) { fout << dist[i] << " "; } fout.close(); return 0; } ``` 在上面的代码中,我们使用了一个优先队列pq来存储待处理的节点,每次选取最小的dist[u]来处理。在处理完u节点后,我们使用OpenMP的并行for循环遍历u的邻居节点v,更新其最距离dist[v]。这样可以加速程序的执行。 最后,我们将结果输出到文件output.txt中,并计算程序的执行时间。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值