ubuntu22.04 RTX4090安装pycuda问题（求教）

最新推荐文章于 2024-06-06 14:49:26 发布

十一贰拾柒

最新推荐文章于 2024-06-06 14:49:26 发布

阅读量578

点赞数 7

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_55477961/article/details/135267739

版权

显卡驱动版本cuda12.2，运行版本12.0，安装pytorch版本对应cuda12.1

pycuda安装命令：

conda install -c conda-forge pycuda

pycuda测试：

import pycuda.driver as drv
import pycuda.autoinit
from pycuda.compiler import SourceModule
import numpy

# 定义核函数
mod = SourceModule(
    """
    __global__ void add_vectors(float *a, float *b, float *c, int n)
    {
        int idx = threadIdx.x + blockIdx.x * blockDim.x;
        if (idx < n)
        {
            c[idx] = a[idx] + b[idx];
        }
    }
"""
)

# 定义向量大小
n = 10000

# 生成随机向量数据
a = numpy.random.randn(n).astype(numpy.float32)
b = numpy.random.randn(n).astype(numpy.float32)

# 分配输出内存空间
c = numpy.zeros_like(a)

# 将输入输出数据复制到 GPU
a_gpu = drv.mem_alloc(a.nbytes)
b_gpu = drv.mem_alloc(b.nbytes)
c_gpu = drv.mem_alloc(c.nbytes)

drv.memcpy_htod(a_gpu, a)
drv.memcpy_htod(b_gpu, b)

# 定义块和网格大小
blocksize = 256
gridsize = (n + blocksize - 1) // blocksize

# 执行核函数
add_vectors = mod.get_function("add_vectors")
add_vectors(
    a_gpu, b_gpu, c_gpu, numpy.int32(n), block=(blocksize, 1, 1), grid=(gridsize, 1)
)

# 将结果从 GPU 复制回 CPU
drv.memcpy_dtoh(c, c_gpu)

# 检查计算结果是否正确
assert numpy.allclose(c, a + b), "result not correct"

# 输出结果
print("a:", a)
print("b:", b)
print("c:", c)

报错：

pycuda.driver.CompileError: nvcc compilation of /tmp/tmpjtjjpnp3/kernel.cu failed
[command: nvcc --cubin -arch sm_89 -I/home/ps/anaconda3/envs/pytorch-pu/lib/python3.10/site-packages/pycuda/cuda kernel.cu.]
[stderr:
nvcc fatal: Value 'sm_89' is not defined for option 'gpu-architecture!

]

十一贰拾柒

关注

7
点赞
踩
9

收藏

觉得还不错? 一键收藏
3
评论
ubuntu22.04 RTX4090安装pycuda问题（求教）

显卡驱动版本cuda12.2，运行版本12.0，安装pytorch版本对应cuda12.1。
复制链接

扫一扫

十一贰拾柒 CSDN认证博客专家 CSDN认证企业博客

码龄3年

10: 原创

144万+: 周排名

12万+: 总排名

4644: 访问

: 等级

119: 积分

8: 粉丝

12: 获赞

6: 评论

23: 收藏

私信

关注

热门文章

分类专栏

SimpleITK 1篇

最新评论

ubuntu22.04 RTX4090安装pycuda问题（求教）
白_九央: 您好报错问题解决了吗？
opencv: solvePnP和matlab: estimateWorldCameraPose 比较
普通网友: 好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
opencv: solvePnP和matlab: estimateWorldCameraPose 比较
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
opencv: solvePnP和matlab: estimateWorldCameraPose 比较
CSDN-Ada助手: 恭喜您第10篇博客的发布！对比opencv中的solvePnP和matlab中的estimateWorldCameraPose的文章内容相信可以帮助很多读者更好地理解两者之间的区别和优劣势。希望您能继续保持创作的热情，探索更多有趣的主题，比如深入研究它们在不同场景下的应用、性能对比等，这样不仅能丰富您的文章内容，也可以为读者提供更多有益的信息。期待您更多精彩的博客！
ubuntu22.04 RTX4090安装pycuda问题（求教）
十一贰拾柒: 是的后面我发现了！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。