CUDA编程入门系列（八）内存管理示例代码

我来了！！！

已于 2023-10-18 23:00:38 修改

阅读量53

点赞数

文章标签：硬件架构

于 2023-10-18 21:05:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45788429/article/details/133914762

版权


#include <stdio.h>
#include <cuda.h>

typedef double FLOAT;

__global__ void sum(FLOAT *x)
{
    int tid = threadIdx.x;

    x[tid] += 1;
}

int main()
{
    int N = 32;
    int nbytes = N * sizeof(FLOAT);

    FLOAT *dx = NULL, *hx = NULL;
    int i;

    /* allocate GPU mem */
    cudaMalloc((void **)&dx, nbytes);

    if (dx == NULL) {
        printf("couldn't allocate GPU memory\n");
        return -1;
    }

    /* alllocate CPU host mem: memory copy is faster than malloc */
    hx = (FLOAT *)malloc(nbytes);

    if (hx == NULL) {
        printf("couldn't allocate CPU memory\n");
        return -2;
    }

    /* init */
    printf("hx original: \n");
    for (i = 0; i < N; i++) {
        hx[i] = i;

        printf("%g\n", hx[i]);
    }

    /* copy data to GPU */
    cudaMemcpy(dx, hx, nbytes, cudaMemcpyHostToDevice);

    /* call GPU */
    sum<<<1, N>>>(dx);

    /* let GPU finish */
    cudaDeviceSynchronize();

    /* copy data from GPU */
    cudaMemcpy(hx, dx, nbytes, cudaMemcpyDeviceToHost);

    printf("\nhx from GPU: \n");
    for (i = 0; i < N; i++) {
        printf("%g\n", hx[i]);
    }

    cudaFree(dx);
    free(hx);

    return 0;
}

我来了！！！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

我来了！！！ CSDN认证博客专家 CSDN认证企业博客

码龄5年

59: 原创

118万+: 周排名

188万+: 总排名

2万+: 访问

: 等级

664: 积分

25: 粉丝

17: 获赞

15: 评论

106: 收藏

私信

关注

热门文章

分类专栏

最新评论

CUDA编程入门系列（十）并行规约
腾昵猫: 引用「有一种可能就是比如说线程1 是将第0个数和第1个数进行相加，也就是说线程1要访问第0个数和第1个数」在第一次循环第0个线程访问的是数组位置0和1的数值，第1个线程访问的是2和3的数值。所以这里的说法不成立。
Slide-Transformer: Hierarchical Vision Transformer with Local Self-Attention论文阅读笔记
小棉花kk: 讲得挺好
MAT: Mask-Aware Transformer for Large Hole Image Inpainting论文阅读笔记
keep--learning: 博主您好，这篇论文您复现了吗
解决Jetson AGX xavier开机在Started update utmp about system runlevel changes卡死
Qi妖: 你好麻烦问一下，这个加载界面的时候按 ctrl alt f2 不起作用是怎么回事，进不去这个tty2模式
TFill：Bridging Global Context Interactions for High-Fidelity Image Completion论文阅读笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。