AI
bachelor2001
这个作者很懒,什么都没留下…
展开
-
CUDA核函数的实现——矩阵卷积
实现二维矩阵卷积操作,初学者水平,欢迎批评指正# -*- coding: utf-8 -*-"""Created on Sun Feb 20 15:50:20 2022@author: xuning"""import pycuda.autoinitfrom pycuda.compiler import SourceModuleimport pycuda.gpuarray as gpuarrayimport numpy as npimport cv2import torchim原创 2022-02-20 17:36:06 · 2414 阅读 · 0 评论 -
实现CUDA核函数——二维矩阵相乘
初学CUDA,自己练手实现二维矩阵乘法,且并发线程数与矩阵计算数据量自适应。计算结果,与调用numpy、torch库的计算方法进行比较验证通过。环境:win10,PyCUDA: (2021, 1),Python: 3.9.7说明:调用时传入的grid、block参数,不能超过GPU的限制,所以需要先调用pycuda.driver库进行相关操作获取,网上有很多资料。代码如下:# -*- coding: utf-8 -*-"""Created on Wed Feb 19 21:33:17原创 2022-02-19 23:55:29 · 943 阅读 · 2 评论