对维度数和索引变量的理解

学习CUDA的第一天!


#include "cuda_runtime.h"
#include "device_launch_parameters.h"

#include <stdio.h>
#include<math.h>
//#include<iostream.h>
#define N 64
#define TPB 32

__device__ float scale(int i, int n) 
{
	return ((float)i / (n - 1));
}

__device__ float distance(float x1, float x2)
{
	return sqrt((x2-x1)*(x2 - x1));
}

__global__ void distanceKernel(float *d_out, float ref, int len)
{
	
	//GridDim为网格中线程块的数目,blockDim为线程块中线程数目,blockIdx为每个线程块的索引,threadIdx为线程在线程块中的索引
	//blockId.x表示每一行有多少线程块,blockIdx.y表示每列有多少线程块
	//,threadIdx.x表示在每一行上的索引,同理.y就表示在列上的,如果没有的话就默认为1  
	//
	const int i = blockIdx.x*blockDim.x + threadIdx.x;
	//归一化
	const float x = scale(i, len);
	//计算x与ref的距离
	d_out[i] = distance(x, ref);
	printf("i = %2d: %f 到 %f 的距离为 %f。\n", i, ref, x, d_out[i]);

}

int main()
{
	const float ref = 0.5f;
	float*d_out = 0;
	//参数是对d_out指针的引用和开辟空间的大小。
	//为什么是引用:因为他要在显存中开辟空间,要是首地址按照形参传递不会改变实参。d_out的地址还是在主存中的地址
	cudaMalloc(&d_out, N * sizeof(float));
	distanceKernel << <N / TPB, TPB >> > (d_out, ref, N);
	cudaFree(d_out);
	//scanf("请输入:");
}

在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值