输入readme里面的训练指令,出现问题:
1、找不到acon模块
解决办法:sys.path.append()方法可以临时添加搜索路径,方便更简洁的import其他包和模块
python sys.path.append()和sys.path.insert()的作用与区别_小学生玩编程的博客-CSDN博客
2、“Couldn’t find any class folder in {directory}.”
解决办法:新建一个文件夹,把验证集放进去,命令窗口写它路径的时候只要写道上一层新建的这个就行
3、
load data sucessfuly
model size is 0.5x
但是后面报错:torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 294.00 MiB (GPU 0; 11.76 GiB total capacity; 10.05 GiB already allocated; 100.75 MiB free; 10.36 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF
可能是batch-size太大,机器跑不起来,改成32后跑起来了,但是还是不对
为什么呢为什么为什么为什么没人教我我真的不会啊,该从哪里学啊,我看了花书还是不会啊,为什么呢为什么呢,我真的一点都不会啊
4、数据集的路径不对
修改数据集路径
5、训练数据集太少,把其他的都解压了
6、学习率从0.5改小到0.1
跑出来了跑出来了!!!我终于跑出来了,纪念一下!纪念一下啊!人生一次跑成功训练模型呜呜呜