CUDA code

最新推荐文章于 2023-04-07 15:06:49 发布

chen_ ：)

最新推荐文章于 2023-04-07 15:06:49 发布

阅读量188

点赞数

分类专栏： ASC学习文章标签： cuda

本文链接：https://blog.csdn.net/weixin_51942493/article/details/123385933

版权

ASC学习专栏收录该内容

28 篇文章 1 订阅

订阅专栏

1

用host指代CPU及其内存，用device指代GPU及其内存
CUDA程序中既包含host程序，又包含device程序
host与device之间可以进行通信，之间可以进行数据拷贝

GPU并行化的工作流程：

CPU发送一种称为kernel的函数到GPU
GPU同时运行该函数的多个版本，称为threads;
thread可以组合成block，一个kernel里的所有thread称为一个grid

__global__是CUDA C/C++的函数修饰符

表示该函数为一个kernel函数, 且
在这里插入图片描述
在调用kernel函数时，函数名后的<<<b, t>>>：

// kernel函数需要运行在4个block上，每个block有2个thread。
#include <stdio.h>

__global__ void myKernel() {
}

int main() {
		//your code here
        myKernel<<<4, 2>>>();
		//end of your code
        printf("Hello, World!\n");
        return 0;
}

kernel函数需要运行在4个block上，每个block有2个thread。
在这里插入图片描述

2

详细介绍函数修饰符:
在这里插入图片描述

//在GPU上运行dev1与dev2函数10次。
#include <stdio.h>

__device__ int dev1() {
}

__device__ int dev2() {
}

__global__ void run10Times() {
	//your code here
	dev1();
	dev2();
	//end of your code
}

int main() {
	run10Times<<<2, 5>>>();
	printf("Hello, World!\n");
	return 0;
}

3

chen_ ：)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CUDA code

1用host指代CPU及其内存，用device指代GPU及其内存CUDA程序中既包含host程序，又包含device程序host与device之间可以进行通信，之间可以进行数据拷贝GPU并行化的工作流程：CPU发送一种称为kernel的函数到GPUGPU同时运行该函数的多个版本，称为threads;thread可以组合成block，一个kernel里的所有thread称为一个grid__global__是CUDA C/C++的函数修饰符表示该函数为一个kernel函数, 且在调用
复制链接

扫一扫

专栏目录