前期
ubuntu 14
anconda3
torch = 0.4.x 上面写着0.3以上的版本,但1.0的话不能使用,
1# 加载预训练的模型
低版本加载高版本的预训练模型出现的错误:
pytorch低版本加载高版本pytorch训练得到的模型,出现‘module’ object has no attribute ‘_rebuild_tensor_v2’错误
参考# https://blog.csdn.net/tsq292978891/article/details/83547963
torch版本的问题的错误:
ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead.
参考#https://blog.csdn.net/ShuqiaoS/article/details/88420326
cd lib/
sh make.sh
出现编译失败
包括GCC 尝试
CUDA_PATH=/usr/local/cuda/ ======》CUDA_PATH=/usr/local/cuda-8.0/
添加以下到make.sh
export CFLAGS="-std=c99"
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
export CPATH=/usr/local/cuda-8.0/include${CPATH:+:${CPATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
数据集的目录就按照README上的安排就完事了
训练
根据README操作基本没问题,根据自己的算力,来设置batch_size ,通过--bs这个就好了,保存的模型会自己弄好的,
测试
不知道为什么我用--multi-gpu-testing,不行,然后用以下的单gpu进行测试了只能
CUDA_VISIBLE_DEVICES=0 python tools/test_net.py --dataset coco2017 --cfg configs/baselines/xxx.yaml --load_ckpt xxx.pth