CUDA学习之旅2009.11.9---《深入浅出CUDA》学习1

最新推荐文章于 2017-08-16 14:37:23 发布

hnuzhoulin

最新推荐文章于 2017-08-16 14:37:23 发布

阅读量1.6k

点赞数

文章标签： cuda thread 语言优化存储工作

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hnuzhoulin/article/details/4791993

版权

今天开始正式学习CUDA，经过前几天的准备工作，已经有了一个基本的认识了。按照网友的意见，先来学习一下《深入浅出CUDA》。今后几天的几篇帖子就大多是讨论这篇文章里的东西了。

以前学习C语言的时候，由于学校很多东西不要求，所以现在来看这些都有点困难啊。慢慢来吧，还希望大家能够多多支持啊。

------------------------------------------------引用原文-------------------------------------------------------

要利用 CUDA 进行计算之前，要先把数据复制到显卡内存中，才能让显示芯片使用。因此，需要取得一块适当大小的显卡内存，再把产生好的数据复制进去。在 main 函式中加入：

GenerateNumbers(data, DATA_SIZE);
    int* gpudata, *result;
    cudaMalloc((void**) &gpudata, sizeof(int) * DATA_SIZE);
    cudaMalloc((void**) &result, sizeof(int));
    cudaMemcpy(gpudata, data, sizeof(int) * DATA_SIZE,
        cudaMemcpyHostToDevice);

----------------------------------------------------over-------------------------

按照里面的提示，这个cudaMalloc函数和C语言的malloc差不多，但是查了一下啊，似乎后面一小截（siazeof后面的）可以理解，就是分配data_size个整数空间，那么前面的(void**) &gpudata是什么意思呢？？？

现在总结一下今天学习所得啊。

1.在CUDA构架下，显示芯片（GPU）执行的最小单位是thread，数个thread组成一个block，但所含thread数目有限；但是执行相同程序的block可以组成grid。

2.发现了几个函数，由于还没有看官方手册programming guide，所以只是初略的根据上下程序了解其意义。如有不对，还望更正。

cudaGetDeviceCount ：取得支持cuda的装置数目

cudaDeviceProp ：一种数据类型，指的是cuda装置的属性

cudaGetDeviceProperties ：取得支持cuda的装置支持的 CUDA 版本，还有装置的名称、内存的大小、最大的 thread 数目、执行单元的频率等

cudaSetDevice ：设定指定装置为目前要使用的装置

cudaMalloc cudaMemcpy----------此二者如前所问问题。

3.在GPU中执行函式，语法规则是

<<<block数目，thread数目，share memory大小>>>（参数...）

4.关于计算时间的统计：

CUDA提供了专门的clock()函式，也有一种数据类型clock_t来定义存储时间的变量。

只要分别在程序运行始末各调用一次clock()，再将解雇相减就可以得出计算时间了。

5.为了充分发挥GPU并行计算的优势，在进行程序优化的时候，要充分考虑显存是DRAM类型，最好是连续存取方式。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

hnuzhoulin CSDN认证博客专家 CSDN认证企业博客

码龄17年

16: 原创

39万+: 周排名

71万+: 总排名

2万+: 访问

: 等级

494: 积分

40: 粉丝

3: 获赞

10: 评论

0: 收藏

私信

关注

热门文章

分类专栏

最新评论

很久没有来这里写写了
benben_shayatou: 写写吧呵呵，俺来看呵呵
CUDA的SDK里的N-body例子疑问
yaoyuanzhi2008: 这里应该就是每个线程计算出sharedPos的一个元素 warp是相当于四舍五入的道理
CUDA的SDK里的N-body例子疑问
yaoyuanzhi2008: 。。。。楼主表述很不清楚 Q为线程数?这里面貌似有很多点，楼主就没有把调用内核函数的部分贴出看来，我们怎么知道是不是一个block。。。
CUDA学习之旅2009.11.10---《深入浅出CUDA》学习2
xiaowen1996: 你好，我是CUDA初学者，最近在看《深入浅出CUDA》，关于你的第二个问题，我起初也看不懂，后来在CPU上模拟了一下，发现确实是可行的。我不知道自己想的是不是对的，能交个朋友，交流一下吗？想听听你时隔一年后的理解
CUDA学习之旅2009.11.9---《深入浅出CUDA》学习1
hero06: LZ,我笔记本电脑是ATI公司的显卡，要运行CUDA程序的话，要么仿真，要么换nvidia公司的显卡吗？谢谢

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。