cuda编程笔记3（理解共享内存和线程同步使用）

最新推荐文章于 2023-10-20 14:43:35 发布

LEDyexu

最新推荐文章于 2023-10-20 14:43:35 发布

阅读量344

点赞数

文章标签： gpu cuda

本文链接：https://blog.csdn.net/LEDyexu/article/details/109191531

版权

共享内存和线程同步计算

功能：对于长度为10的数组，用10个线程同步计算当前元素之前所有元素的平均值。

#include <stdio.h>
#include "cuda_runtime.h"

#include "device_launch_parameters.h"

__global__ void gpu_shared_memory(float *d_a)
{
   
	// Defining local variables which are private to each thread
	int i, index = threadIdx.x;
	float average, sum = 0.0f;
	//Define shared memory
	__shared__ float sh_arr[10];


	sh_arr[index] = d_a[index];

	__syncthreads()

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LEDyexu

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
cuda编程笔记3（理解共享内存和线程同步使用）

目录共享内存和线程同步计算共享内存和线程同步计算功能：对于长度为10的数组，用10个线程同步计算当前元素之前所有元素的平均值。#include <stdio.h>#include "cuda_runtime.h"#include "device_launch_parameters.h"__global__ void gpu_shared_memory(float *d_a){ // Defining local variables which are private to
复制链接

扫一扫