CMakeLists.txt 中解决 error : identifier “__ldg“ is undefined

最新推荐文章于 2023-04-01 08:47:37 发布

爱学习的小道长

最新推荐文章于 2023-04-01 08:47:37 发布

阅读量280

点赞数 1

分类专栏： cuda 文章标签： c++ 矩阵

本文链接：https://blog.csdn.net/weixin_40378209/article/details/128929638

版权

cuda 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

参考：

c++ - 编译时在 cuda 内核中使用 __ldg 时出错
identifier “__ldg” is undefined

正文：

__ldg()原型为：

T __ldg(const T* address)

对于计算能力大于等于3.5的 NVIDIA GPU 来说，可将一些只读全局内存数据使用__ldg()函数通过只读数据缓存读取，可达到使用纹理内存加速效果，又可使代码简洁。
T 是需要读取的数据类型，address 是数据的地址。对帕斯卡架构和更高的架构来说，全局内存的读取在默认情况下就利用了__ldg()函数。

我使用的显卡是：

Device name:                                NVIDIA GeForce GTX 1060 6GB
Compute capability:                         6.1

使用CMakeLists.txt 管理代码时运行报错，应该是没有指定计算能力
CMakeLists.txt 中添加：

set(CUDA_NVCC_FLAGS -arch=compute_61; -code=sm_61)

使用demo：

__global__ void transpose(const real *A, real *B, const int N)
{
    const int nx = blockIdx.x * blockDim.x + threadIdx.x;
    const int ny = blockIdx.y * blockDim.y + threadIdx.y;
    if (nx < N && ny < N)
    {
        B[ny * N + nx] = __ldg(&A[nx * N + ny]);
    }
}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

爱学习的小道长

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CMakeLists.txt 中解决 error : identifier “__ldg“ is undefined

CMakeLists.txt 中解决 error : identifier "__ldg" is undefined
复制链接

扫一扫