尝试OpenMP编译成CUDA的失败经历

2 篇文章 0 订阅
1 篇文章 0 订阅

一次失败的尝试,记录一下。

现有代码使用OpenMP优化的,想在不改代码的情况下直接通过编译成GPU代码加速,网上搜索了一番,IBM提供了基于Power9架构的OpenMP GPU支持[1]. 不适合X86平台。

1. 参考:https://parallel-computing.pro/index.php/9-cuda/43-openmp-4-0-on-nvidia-cuda-gpus,编译成功

host:Ubuntu 18.04 dev, CUDA 9.1.85-1, gcc6 6.4.0-12ubuntu1

libomptarget 有一处编译失败,原因是cu代码里使用了c99 的complex.h,但是cuda默认是使用c++编译,会导致c里定义的宏complex没法正常展开成_Complex,需要强制定义一下。

问题:编译好的程序只能编译c程序,编译c++程序会遇到链接问题

2. 参考:https://github.com/clang-ykt/clang/wiki

这个版本是上一个链接里的更新版本,编译这个的时候我退回到了cuda 8/gcc 5编译

同样需要重定义complex

问题:libomptarget-nvptx 只能静态链接成.a,动态链接报错


结论:OpenMP 4对GPU的支持现在在X86平台上还不可用,暂时没有偷懒的办法大哭


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值