CUDA库的通用工作流程

1.创建一个函数库句柄

句柄包含了库的一些上下文信息,如使用的数据结构格式,用于计算的设备端的使用。

2.分配设备内存

一般使用cudaMalloc分配设备内存,在使用多GPU编程库时,需要使用API来分配设备内存。

3.将输入数据转换为函数库支持的格式

如程序的数组是行优先,但是cuda库只接受按列优先存储的数组,这种时候就要进行数据转换了,但是也可以在创建的时候保持与cuda库的数据格式一致。

4.将输入数据传送到设备内存

在使用cublas库时,使用的就是cublasSetVector。

5.配置函数库

一般情况下只是传递一些需要的参数。

6.执行

7.取回设备内存中的结果

8.将数据转换为原始格式

9.释放cuda资源

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值