如何将传统代码加载到GPU中加速

最新推荐文章于 2024-06-17 20:39:03 发布

sinat_38007523

最新推荐文章于 2024-06-17 20:39:03 发布

阅读量724

点赞数 2

分类专栏： python 文章标签： numpy python 深度学习 pytorch

本文链接：https://blog.csdn.net/sinat_38007523/article/details/129525132

版权

15 篇文章 1 订阅

订阅专栏

文章详细对比了在CUDAGPU环境与NumPy之间进行tensor转换的步骤，以及在PyTorch中如何实现各种数学运算，包括随机数生成、矩阵操作、采样、数学函数、布尔操作和矩阵形状变换。此外，还讨论了如何将字典类型的对象转换为CUDA兼容的格式。

摘要由CSDN通过智能技术生成

设置cuda

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
 
model.to(device)

由于numpy比较基础和通用，但是GPU上跑实验必须使用tensor，故还是直接用torch里面的函数更加直接快速，其两者直接的对比整理如下：

import numpy as np
import torch
import torch.nn.functional as tnf

用途	numpy	torch
给定集合a，给定各元素权值p，有/无放回的抽样	np.random.choice(a, size=None, replace=True, p=None)	torch.multinomial(weight, num_samples, replacement=False)

用途	numpy	torch
取幂	np.power(2,3)	torch.pow(torch.tensor([2]),torch.tensor([3]))
取指数	np.exp(x)	torch.exp(x)
矩阵求逆	np.linalg.inv(a)	torch.inverse(a)
向量点积	np.dot(a,b)	torch.dot(a,b)
转置	a.T	a.T
矩阵相乘	np.matmul(a,b)	torch.matmul(a,b)
对a保留d位小数，后面的四舍五入	np.round(a,d)
求解一个向量或者矩阵的范数		a.norm()/torch.norm(a)
获得最大的k个元素		a.topk(k)
求累加和	np.cumsum(a)	torch.cumsum(a)
求最大值（可按照维度）	np.max(a)	torch.max(a)
求最小值（可按照维度）	np.min(a)	torch.min(a)
求最大值所在位置（可按照维度）	np.argmax(a)	torch.argmax(a)
求最小值所在位置（可按照维度）	np.argmin(a)	torch.argmin(a)
求多个随机变量（一个随机变量代表一行）的 Pearson product-moment correlation coefficients（可以认为类似于协方差矩阵）.	np.corrcoef(a)
沿着某一个维度，计算相邻元素的差	np.diff(a)	torch.diff(a)

用途	numpy	torch
高维矩阵扁平化	a.flatten()	a.flatten()=a.flatten(start_dim=0, end_dim=-1)=torch.flatten(a,start_dim=0, end_dim=-1)
生成第k个维度	np.expand_dims(a,k)	torch.unsqueeze(a,k)

先说torch,这一类操作是torch开发出来节省计算效率和提高数值稳定性的，比如softmax和log结合。

用途	numpy	torch
先softmax后log		tnf.log_softmax(a)
先exp,然后sum,然后对求和结果log		torch.logsumexp(a)

obj=obj.cuda()

其中obj是一个字典，但是字典类型不支持直接cuda（）操作。可以用下面的方法将obj的每个value都变成cuda（）类型。

obj={key:obj[key].cuda() for key in obj}

关注

专栏目录