CUDA——常量内存初始化

介绍

常量内存有多种初始化方式:

__constant__ int arrA[10];
__constant__ int arrB[3] = {1,2,3};
__constant__ int C = 5;

int main(int argc, char** argv)
{
	......
	int h_arr[10] = {1,2,3,4,5,6,7,8,9,0};
	cudaMemcpyToSymbol(arrA, h_arr, sizeof(int) * 10);
}

但是有时候我们需要将一个变量声明为常量,并且这个值需要在执行host代码之后再确定的,例如:

__constant__ int D;
int main(int argc, char** argv)
{
	......
	int h_D;
	cin >> h_D;
	cudaMemcpyToSymbol(&D, &h_D, sizeof(int));
}

运行该代码会报错:

Error: test.cu:29, code: 13, reason: invalid device symbol

分析

一开始我以为是设备常量变量无法在主机代码中通过&符号直接解析出地址,于是我调用cudaGetSymbolAddress函数来获取常量D的地址:

int* tmp_ptr;
cudaGetSymbolAddress((void**)&tmp_ptr, D);
cudaMemcpyToSymbol(tmp_ptr, &tmp, sizeof(int))

结果依然报错。

答案

对变量进行常量声明之后,需要在主机代码中为其分配内存空间。

__constant__ int D;
int main(int argc, char** argv)
{
	......
	int h_D;
	cin >> h_D;
	cudaMalloc((void**)&D, sizeof(int));
	cudaMemcpyToSymbol(D, &h_D, sizeof(int));
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值