![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pytorch
深度学习pytorch
orientliu96
一直努力成长的小菜鸡
展开
-
[Open3D WARNING] GLFW Error: X11: Failed to open display :0
linux 系统无法打开open3d的可视化窗口,报错信息如下。原创 2023-07-20 21:52:27 · 2251 阅读 · 2 评论 -
pytorch grid_sample易错点
output的size和grid的size是一样的,所以output中某一位置(h, w)的值,是根据grid的同一位置(h,w)提供的index信息去input中寻找。如果input的网格中存在这个索引,直接赋值。若不存在,则进行插值计算。那么如果想得到非转置的结果,就要将grid更改一下。output是input的转置。原创 2023-07-10 16:51:17 · 652 阅读 · 0 评论 -
逐行统计python代码执行时间
逐行统计python代码执行时间在炼丹或者debug的过程中,我们经常需要去逐行统计代码运行的时间。使用time.time()是可以解决问题,但是过于繁琐。于是通过一顿踩坑,推荐使用line_profiler库, 安装方式如下,十分简单。pip install line_profiler安装成功,下面开始介绍如何使用。from __future__ import print_functionfrom line_profiler import LineProfilerimport tor原创 2020-12-16 23:09:14 · 1464 阅读 · 2 评论 -
ImportError: /lib64/libm.so.6: version `GLIBC_2.27‘ not found
ImportError: /lib64/libm.so.6: version `GLIBC_2.27’ not found (required by /home/labpos/anaconda3/envs/rpmnet/lib/python3.6/site-packages/open3d/open3d_pybind.cpython-36m-x86_64-linux-gnu.so)这应该是open3d版本不兼容引起的,将版本卸载,重新安装0.9版本的open3d。conda install -c ope原创 2020-06-30 19:27:51 · 15607 阅读 · 6 评论 -
subprocess.CalledProcessError: Command '['/home/labpos/anaconda3/envs/idr/bin/python', '-u', 'main_d
subprocess.CalledProcessError: Command ‘[’/home/labpos/anaconda3/envs/idr/bin/python’, ‘-u’, ‘main_distribute.py’, ‘–local_rank=1’]’ returned non-zero exit status 1.pytorch DistributedDataParallel训练时...原创 2020-04-07 21:28:06 · 21284 阅读 · 14 评论 -
OSError: Unable to open fle (unable to lock file, errno = 37, error message = 'No locks available')
OSError: Unable to open file (unable to lock file, errno = 37, error message = ‘No locks available’)在使用python读取h5文件时出现以上错误这一问题通常是由于在 NFS 文件系统中的问题,直接在 ~/.bashrc 文件中加入export HDF5_USE_FILE_LOCKING=FA...原创 2020-03-25 13:35:08 · 6519 阅读 · 9 评论 -
pytorch scatter_add_用法
pytorch torch.scatter_add_()函数用法self_tensor.scatter_add_(dim, index_tensor, other_tensor) 函数的作用将other_tensor中的数据,按照index_tensor中的索引位置,添加至self_tensor中这里给出官网的说明,非常清晰解释起来就是,dim决定了哪个维度的索引是由index te...原创 2020-03-12 22:48:57 · 6894 阅读 · 2 评论 -
pytorch torch.where用法
pytorch torch.where()函数用法torch.where(condition, x, y) → Tensor函数的作用根据条件,返回从x,y中选择元素所组成的张量。如果满足条件,则返回x中元素。若不满足,返回y中元素。例子...原创 2020-03-12 20:55:49 · 39987 阅读 · 0 评论 -
Pytorch 不训练(frozen)一些神经网络层的方法
Pytorch 不训练(frozen)一些神经网络层的方法我们在做深度学习的时候经常会使用预训练的模型。很多情况下,加载进来模型是为了完成其他任务,在这种情况下,加载模型的一部分是不需要再训练的。那么我们就需要forozen这些神经网络层。固定某些层训练,就是将tensor的requires_grad设为False。此外,一定要记住,我们还需要在optim优化器中再将这些参数过滤掉!下面见...原创 2020-03-06 22:33:21 · 4357 阅读 · 0 评论 -
Pytorch distributed 多卡并行载入模型
Pytorch distributed 多卡并行载入模型前面的博客介绍了pytorch多卡distribute的方法,这次来介绍下如何载入模型。目前没有找到官方的distribute 载入模型的方式,所以采用如下方式。大部分情况下,我们在测试时不需要多卡并行计算。所以,我在测试时只使用单卡。from collections import OrderedDictdevice = tor...原创 2020-03-06 19:34:47 · 1139 阅读 · 1 评论 -
Pytorch distributed RuntimeError: Address already in use
Pytorch distributed RuntimeError: Address already in use如果是使用pytorch distributed 单机多卡训练方式,出现该错误,非常好解决。Traceback (most recent call last): File "main1.py", line 279, in <module> train(args...原创 2020-03-01 18:25:37 · 26454 阅读 · 5 评论 -
pytorch DistributedDataParallel多卡并行训练
pytorch DistributedDataParallel多卡并行训练Pytorch 中最简单的并行计算方式是 nn.DataParallel。DataParallel 使用单进程控制将模型和数据加载到多个 GPU 中,控制数据在 GPU 之间的流动,协同不同 GPU 上的模型进行并行训练。但是DataParallel的缺点十分明显,各卡之间的负载不均衡,主卡的负载过大。运行时间大概是d...原创 2020-03-01 17:58:48 · 7726 阅读 · 5 评论 -
apex Error : Given no hashes to check 137 links for project 'pip': discarding no candidates
apex Error : Given no hashes to check 137 links for project ‘pip’: discarding no candidatesAPEX是英伟达开源的,用于改变数据格式来减小模型显存占用的工具,完美支持PyTorch框架。但是我们在按照如下命令进行安装时会出现错误git clone https://github.com/NVIDIA/ape...原创 2020-02-29 22:42:16 · 5304 阅读 · 9 评论 -
pytorch 多卡并行载入部分网络模型
pytorch 多卡并行载入部分网络模型我们在做深度学习的时候经常会使用预训练的模型。但是一旦自己修改了网络架构,就无法load pretrained model。 因为模型文件保存的参数,有一部分是不需要的,或者有一部分参数是缺失的。为了在这种情况下,成功导入模型,我们需要如下操作操作的前提是我们存在已保存的模型参数model = Net()torch.save(model.state...原创 2020-02-29 22:35:42 · 684 阅读 · 0 评论 -
PyTorch常用激活函数解析
PyTorch常用激活函数在深度学习中,经常会见到各种各样的激活函数。为了更好的学习,总结下我经常用的激活函数。具体信息可见官网sigmoid所有的输出会被放缩在0到1之间缺点:会导致梯度消失的问题,网络只有微小的更新,无法有效学习整流线性单元ReLU表达式:ReLU(x)=max(0,x)优点:相比于 sigmoid,由于稀疏性,时间和空间复杂度更低;不涉及成本更高...原创 2020-02-01 22:30:55 · 2254 阅读 · 0 评论 -
RuntimeError: module must have its parameters and buffers on device cuda:2 (device_ids[0]) but found
RuntimeError: module must have its parameters and buffers on device cuda:2 (device_ids[0]) but found one of them on device: cuda:0出现这个问题是使用一机多卡分布式训练时,没有调用显卡0,例如使用显卡1,2,3进行训练。使用的模块是pytorch nn.DataPar...原创 2019-12-27 09:48:16 · 3455 阅读 · 1 评论 -
如何快速安装低版本pytorch0.4.1和对应的torchvision
如何快速安装低版本pytorch0.4.1和对应的torchvision做深度学习时候,经常需要跑别人的模型。但是大家使用的pytorch或tensorflow版本不同。有的甚至版本很落后,这就需要我们去搭建相应旧版本的环境。例如,使用anaconda创建虚拟环境安装不同深度学习框架 。首先安装低版本的pytorch最常见的安装pytorch命令为conda install pytorch...原创 2019-12-26 16:00:18 · 8017 阅读 · 3 评论