CUDA简要学习

最新推荐文章于 2023-03-05 08:33:53 发布

VIP文章 Bryan要加油

最新推荐文章于 2023-03-05 08:33:53 发布

阅读量949

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sjt19910311/article/details/51180186

版权

GPU线程

void some_func(int *a,int *b,int *c)
{
    for(int i = 0;i<128;++i)
        a[i] = b[i] * c[i];
}

这段代码很简单，在CUDA中，我们可以将这段代码直接转换成用128个线程，每个线程都执行下面这段代码：

a[i] = b[i] * c[i];

　　在CUDA中，可以通过创建一个内核函数的方式，将循环并行化。所谓的内核函数，就是一个只能在GPU上执行，而不能直接在CPU上执行的函数。
　　按照CUDA的编程模式，CPU主要处理它所擅长的串行代码，GPU主要执行密集计算的代码块。
　　从概念上看，GPU的内核函数和循环体是一样的，只不过将循环的结构移除了。下面这段代码就是一个内核函数　　

__global__ void some_kernel_func(int * const a,const int *const</

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
CUDA简要学习

GPU线程void some_func(int *a,int *b,int *c){ for(int i = 0;i<128;++i) a[i] = b[i] * c[i];}这段代码很简单，在CUDA中，我们可以将这段代码直接转换成用128个线程，每个线程都执行下面这段代码：a[i] = b[i] * c[i];　　在CUDA中，可以通过创建一个内核函数的方式，将循环并
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。