Pytorch
文章平均质量分 62
带鱼工作室
欢迎一起讨论
展开
-
2080Ti与3080Ti单机多卡安装与并行训练
1 本人环境机器:dell T640服务器系统:Ubuntu16.04 LTS已安装显卡:2080Ti已安装驱动版本:NVIDIA-Linux-x86_64-470.57.02.run已安装cuda版本:cuda_10.0.130_410.48_linux.run已安装cudnn版本:cudnn-10.0-linux-x64-v7.4.2.24.tgz需求:与服务器无关,大家只要是Ubuntu16.04系统即可参考。由于目前需求,需要扩充一张3080Ti显卡,但全网关于2080T原创 2021-11-23 21:18:08 · 3820 阅读 · 3 评论 -
RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED
RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED该错误是在cuda:10.0 pytorch:1.2 GPU服务器环境下训练模型出的问题,错误提示CUDNN状态执行失败该错误的问题在于cuda的版本与pytorch的版本不对应,导致cuda不能加速模型的训练同时执行失败。在下载pytorch时,我们需要在官网正确下载 pytorch与cuda的版本对应关系,在本机训练模型时,我的环境为cuda 10.0 ,pytorch 1...原创 2021-10-05 20:58:46 · 325 阅读 · 0 评论 -
RuntimeError: Expected hidden[0] size (x, x, x), got(x, x, x)
先上图:上图是在训练BILSTM网络时出现的问题。问题描述:通过定义BILSTM网络的初始权重h0,c0,并将其作为BILSTM的初始权重输入至网络,通过如下代码实现output, (hn, cn) = self.bilstm(input, (h0, c0))网络结构如下所示:self.bilstm = nn.LSTM( input_size=self.input_size, hidden_size=self.hidden_siz.原创 2021-10-05 14:37:56 · 5845 阅读 · 1 评论 -
windows安装CPU版本 torch_geometric教程
由于最近需要搞图神经网络(GNN),因此需要安装torch_genmetric:Graph Neural Network Library for PyTorch,torch_genmetric 封装了图神经网络常用的算法,例如 GCN(图卷积网络)、GAT(图注意力网络)等等,因此安装其是十分必要的。本人环境配置:系统:windows10,python版本:3.6.1,pytorch版本:1.5.0+cpu在尝试官网方法安装失败后,通过下载安装文件到本地后成功安装torch_genmetric,现.原创 2021-10-01 21:56:54 · 3694 阅读 · 2 评论 -
RuntimeError: cuda runtime error (59) : device-side assert triggered at XXX
如上图所示为使用Ubuntu GPU服务器训练文本分类模型时发生的错误,单纯看最后的错误很难看出错误来源,但我们注意到错误中提示了loss.backward()发生了问题,也就是loss计算的错误。 这种问题大部分是标签定义的问题,可以看到在程序中第七行我定义了一个class_dict的一个字典,用于存储类别对应的id,刚刚说到了这种问题大部分是标签定义的问题,观察一下我定义的标签,是由 1 ~ 7,起初认为这种定义没有问题,但大家需要注意的是 模型输出后是根据arg...原创 2021-07-27 12:15:56 · 476 阅读 · 0 评论 -
RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED
如上图所示为在 Ubuntu 服务器上训练深度学习网络出现的问题, Pytorch版本1.2, cuda版本10,在训练关系抽取的分类任务时出现的错误。 根据错误 RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED的字面理解是CUDNN的状态没有初始化,但我通过该环境是可以训练其他深度学习模型的,所以这和cuda、pytorch的版本是没有任何关系的,其他博客都在说是Pytorch的版本与cuda版本不对应导...原创 2021-07-27 11:55:39 · 43842 阅读 · 24 评论 -
Pytorch学习笔记系列 - 激活函数
1 什么是激活函数(activation functions)?在神经网络中经常会提及激活函数的概念,那么什么是激活函数?为什么要使用激活函数?激活函数是为了解决实际生活中不能使用线性方程概括的问题。那么什么是线性方程呢?举个例子来说,一道菜越好吃,那么吃的人越多,这就是一个线性问题(Linear)。现在将例子所处的环境改成在校园中,菜越好吃,吃的人数也不能无穷增长下去,那么此时线性问题就转化为非线性问题(NonLinear),也就是函数图像将不再是一条直线,而是转化为一条曲线。那么由线原创 2020-07-12 21:19:11 · 505 阅读 · 0 评论 -
Pytorch学习笔记系列-Variable
回顾:在上一节中介绍了tensor的基本构造方法 --->Pytorch学习笔记系列-Torch基本操作本节将介绍 Variable1 什么是Variable?通过上一节的介绍我们知道了什么是tensor,tensor是torch计算的基本结构,就相当于在Numpy中计算需要使用array格式一样。那么Variable到底是做什么的呢?我们知道torch库中提供了很多深度学习、神经网络的方法,那么当我们在神经网络节点中使用变量时的格式就是Variable格式。除了内部的参数外,Vari..原创 2020-07-11 22:07:04 · 1277 阅读 · 0 评论 -
Pytorch学习笔记系列-Torch基本操作
目录1.Pytorch介绍与安装1.1 介绍1.2 Pytorch安装2 Torch2.1 Tensor构造2.1.1 torch.from_numpy构造 - 维度任意2.1.2 使用数组直接构造 - 维度任意2.1.3torch.eye构造 - 多维2.1.4torch.linspace构造 - 一维2.1.5torch.logspace 构造- 一维2.1.6torch.ones构造 - 多维2.1.7torch.zeros构造 - 多...原创 2020-07-11 16:19:28 · 2329 阅读 · 0 评论