cuda 使用trust库计算最值

Thrust是并行算法和数据结构的基于GPU CUDA的C++库,类似于C++标准库stl,cuda安装后自带。Trust用于求最值的函数为min_element和max_element,和stl名字一样;

我是偶然发现原来cuda还有一个这个库,在项目中,因为中间有一个过程需要最值的索引,原本我是把数据从显存中拷贝到主机,然后使用stl的标准库计算的,因为主机与设备之间的数据交换慢,速度不是很理想,本来想自己写核函数了,突然百度冒出来一个这个库,真是久旱逢甘霖啊;

以max_element为例,一种方法是使用容器:

 thrust :: host_vector< float> h_vec(100); 
 thrust :: generate(h_vec.begin(),h_vec.end(),rand); 
 thrust :: device_vector< float> d_vec = h_vec; 
 
 thrust :: device_vector< float> :: iterator iter = 
 thrust :: max_element(d_vec.begin(),d_vec.end()); 
 
 int position = iter - d_vec.begin(); 
 float max_val = * iter; 
 
 std :: cout<< 最大值是”< max_val<< at position”<<位置<< std :: endl;

但是容器有个麻烦事,在cuda计算中,核函数等不可能全部用容器当参数传入,如果求最值用容器,还得把指针所对应值压入容器中,数据小无多大关系,如果太大,又是一个消耗时间的事,这时可以用device_ptr:

假设有一个设备指针dev_ptr,长度为N:

thrust::device_ptr<float> d_ptr=thrust::device_pointer_cast<dev_ptr>;
thrust::device_ptr<float> iter=thrust::max_element(d_ptr,d_ptr+N);
float maxValue=*iter;
int pos=iter-d_ptr;

这里主要用到了指针地址的概念,因为通过new,malloc等申请的地址为虚拟地址,虽然对应的物理地址不一定连续,但虚拟地址是一定连续的,这样通过地址相减,就可以得到索引值;

更多Trust的详情可以参考博客:https://blog.csdn.net/yychentracy/article/details/90729326

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值