此外,model_dir路径下还保存了只训练仅一次的ckpt模型。
原因:我的是RTX3070 ,有8G的显存 但还是不够
在启动模型前执行以下命令监测显存使用情况,看到显存使用率突然飙升 直到Killed!
watch -n 2 nvidia-smi # 2表示每两秒钟刷新显示一次
解决:
①设置batch_size=1 #尽量设小点,但我还是不行
②切割图片 # dota数据集的特点了,单张图片较大
切割方式:
git clone https://github.com/hukaixuan19970627/DOTA_devkit_YOLO.git
用项目里的ImageSpilt.py切割(我的参数设置subsize=512, gap=196, 还有两个path)
最后感谢liucui和以下参考的灵感,解决了一下午的难题!