Cuda C权威指南学习笔记（一）

最新推荐文章于 2023-03-20 11:41:26 发布

二进制玩家

最新推荐文章于 2023-03-20 11:41:26 发布

阅读量369

点赞数

分类专栏：并行计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zxtalentwolf/article/details/84886191

版权

并行计算专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本次目录

Hello world 例程

Hello world 例程

编译第一个hello文件, 首先创建hello.cu
```
#include<iostream>
using namespace std;
int main(){
  cout<<"Hello world"<<endl;
}
```
执行nvcc hello.cu -o hello, ./hello得到nvcc编译得到的可执行文件并运行
上面没有用到任何GPU特性，只是个主机程序，下面编写我们第一个设备程序，修改上面的代码得到新的代码
```
#include<iostream>
#include<stdio.h>
using namespace std;
__global__ void helloFromGPU(void){
    printf("Hellow World from GPU\n");
}
int main(){
    cout<<"Hello World from CPU"<<endl;
    helloFromGPU<<<1,1>>>();
}
```
执行同样的编译步骤，得到结果在这里插入代码片
```
Hello World from CPU
Hellow World from GPU
Hellow World from GPU
Hellow World from GPU
Hellow World from GPU
Hellow World from GPU
Hellow World from GPU
Hellow World from GPU
Hellow World from GPU
Hellow World from GPU
Hellow World from GPU
```
可以看到 cpu运行了1次，gpu运行了10次·，这是因为有十个线程运行，特别注意cudaDeviceReset这个函数，没有这个函数printf是没法输出的。

Cuda的编程结构：
1. 分配GPU内存
2. 从CPU内存中拷贝数据到GPU内存。
3. 调用CUDA内核函数完成运算
4. 将数据烤回到CPU内存
— 《CUDA C权威指南》

Cuda抽象了硬件细节：线程组层次结构，内存层次结构，障碍同步。

二进制玩家

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Cuda C权威指南学习笔记（一）

本次目录Hello world 例程Hello world 例程编译第一个hello文件, 首先创建hello.cu#include&lt;iostream&gt;using namespace std;int main(){ cout&lt;&lt;"Hello world"&lt;&lt;endl;}执行nvcc hello.cu -o hello, ./hello得到n...
复制链接

扫一扫

专栏目录

二进制玩家

博客等级

码龄10年

58
原创

14
点赞

57
收藏

5
粉丝

关注

私信

热门文章

分类专栏

计算机图形学 2篇
Leetcode 37篇
tensorflow 1篇
PAT 2篇
CAFFE 3篇
机器学习 4篇
MOT 2篇
计算机 9篇
JS 1篇
并行计算 2篇

最新评论

MOT17数据集格式
k_c_u_f: 有没有软件可以制作自己的gt文件？
MOT17数据集说明
ccgg23: 同问，2DMOT15中的train中的gt文件和MOT17中的train中的gt文件格式也不相同
MOT17数据集说明
Little Frog: 请问你知道怎么生成了么
MOT17数据集说明
weixin_48039184: 博主您好，请问一下，MOT16数据集和MOT17数据集除了检测器不同之外，还有什么不同的地方，有说这两个数据集一模一样的，但是为什么MOT16中的train中的gt文件和MOT17中的train中的gt文件不相同？
Opencv编译出现compute_11 not support解决方法
征远: 遇到类似的问题，从以下链接查到 1070 对应compute_61 https://www.cnblogs.com/learnAI/p/12436540.html ,填在 CUDA_ARCH_BIN ，也可以了。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。