- 博客(3)
- 收藏
- 关注
原创 【已解决】多GPU数据并行训练断点后重新训练问题
加载模型后,要先放在一个gpu上,也就是to(device),然后再net = nn.DataParallel(net)发现和其他人报错相反,他们miss fc0,unexpected module.fc0。发现模型里没有module,所以思路应该是先加载模型,再放到多个GPU上面。
2023-08-18 10:16:28 198 1
原创 虚拟环境和系统中CUDA版本不同的解决方法
然后,使用pip卸载torch和torchvision,去官网下载whl包,比如你要安装torch=1.12.1,不用pip install torch==1.12.1,可以尝试pip install torch==1.12.1+cu116 或者官网下载对应的whl再pip install xxxx.whl。CUDA是NVIDIA的并行计算平台和应用程序接口,用于在NVIDIA GPU上进行加速计算。不同的CUDA版本与不同的PyTorch版本可能需要特定的兼容性,以确保正确的GPU加速。
2023-08-15 16:15:54 1864
原创 NPM3D数据集测试结果提交失败(已解决)
问题:使用NPM3D提供的测试集进行测试,分割出语义标签提供给NPM3D基准评估出现failed。我的问题是在有一个场景的标签出现0,就是未分类点,所以提交不成功。2.三个场景标签固定名称放在一个文件夹下,使用7-zip压缩。1.生成三个场景的标签文本文件(1000w行,标签1-9)
2023-04-10 21:53:04 322 5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人