completely automatic design CNN architecture based on blocks源码ea-CNN：调试遇到的问题

最新推荐文章于 2023-09-11 09:47:58 发布

五取蕴_41121879

最新推荐文章于 2023-09-11 09:47:58 发布

阅读量495

点赞数 2

分类专栏：论文二维图像处理 CNN 文章标签：神经网络 pytorch

本文链接：https://blog.csdn.net/qq_41121879/article/details/103488910

版权

二维图像处理同时被 3 个专栏收录

8 篇文章 0 订阅

订阅专栏

论文

3 篇文章 0 订阅

订阅专栏

CNN

3 篇文章 0 订阅

订阅专栏

问题一、在执行下面这句代码

 trainloader, validate_loader = data_loader.get_train_valid_loader('D:\major\NN\datasets\cifar10\cifar-10-python\cifar-10-batches-py', batch_size=128, augment=True, valid_size

读取数据集的时候，出现如下的错误：
^
SyntaxError: (unicode error) ‘unicodeescape’ codec can’t decode bytes in position 8-9: malformed \N character escape
这篇文章说
报错是因为在Windows下的文件路径是 “”,但是在代码中会被编译为转义字符，所以正确的用法是将其修改成“/”,或者是双杠“\” 即D:/major/NN/datasets/cifar10/cifar-10-python/cifar-10-batches-py
或者D:\major\NN\datasets\cifar10\cifar-10-python\cifar-10-batches-py
然后改完就可以了
问题二、在训练模型时，执行train()函数时，本来设置的batch=128，出现的错误oom:
Exception occurs, file:indi0003, pid:15312…CUDA out of memory. Tried to allocate 32.00 MiB (GPU 0; 2.00 GiB total capacity; 1.24 GiB already allocated; 14.62 MiB free; 110.38 MiB cached)
然后看网上有的说可以将batchsize改得小一点，然后就改成batch=32就行了。如果还是不行的话，就16,8，1
训练模型时出现GPU不够用的时候，清理GPU或者减少batch，
这个问题可以看看这里pytorch GPU 显存释放的问题？
问题三、调试的时候发现在训练模型运行train()函数时，
pytorch报错：IndexError: invalid index of a 0-dim tensor. Use tensor.item() to convert a 0-dim tensor to a Python number
是前后用的torch版本不同造成的。
解决：将loss.data[0] 改成loss.item()

 # running_loss += loss.data[0]*labels.size(0)
 running_loss += loss.item()*labels.size(0)

这里参考invalid index of a 0-dim tensor

五取蕴_41121879

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
8
评论
completely automatic design CNN architecture based on blocks源码ea-CNN：调试遇到的问题

问题一、在执行下面这句代码 trainloader, validate_loader = data_loader.get_train_valid_loader('D:\major\NN\datasets\cifar10\cifar-10-python\cifar-10-batches-py', batch_size=128, augment=True, valid_size读取数据集的时候，...
复制链接

扫一扫

专栏目录