大概率是因为pytorch版本的问题,在2.0版本中local_rank变为了local-rank
1.首先把数据集里的label.cache清掉
2.train.py中的arg里的local_rank改为local-rank如下所示:
3.重新开始训练
python -m torch.distributed.launch --nproc_per_node 4 --master_port 9527 train.py --workers 8 --device 0,1,2,3 --sync-bn --batch-size 32 --data data/CrowdHumanVBOX.yaml --img 640 640 --epoch 3 --cfg cfg/training/yolov7-tiny.yaml --weights '' --name yolov7 --hyp data/hyp.scratch.tiny.yaml