深度学习
躺鸡小能手
这个作者很懒,什么都没留下…
展开
-
pytorch-GPU分布式训练笔记
这篇博客可能会存在很多不正确的地方,麻烦大神指正,后期我会慢慢修改 1.如果我有8片卡,但只想用其中的两片,比如显卡7和显卡8(假设索引从1开始,其实可能是0) 我们先创建好模型: import torch.nn as nn inport torchvision.models as models model = models.vgg16(pretrained = False) model...原创 2018-11-19 09:55:10 · 2962 阅读 · 0 评论 -
推荐博客
https://blog.csdn.net/eatapples/article/details/80205630 -----pytorch 实现alexNet + imagenet 部分数据 https://blog.csdn.net/u010866505/article/details/77857394 -----不用框架,python实现卷积神经网络 https://blog....原创 2019-04-17 19:07:26 · 206 阅读 · 0 评论 -
利用GPU训练时的常见错误
1.CUDA_VIDIBLE_DEVICES=4,5 python3 main.py 我想在集群条件下利用4,5号GPU,由于模型较小,并不清楚是都可以指定4,5号GPU(内存占用情况看不出来。。。后续会找找其他验证办法),报了如下几个错误: all tensors must be on devices[0]: CUDNN_STATUS_INTERNAL_ERROR:目前找到了两个解决办法...原创 2018-11-24 16:03:03 · 1613 阅读 · 0 评论