使用了autodl租用3080服务器,数据6.7G,包含一共1200帧标注好的数据,36000张视频截取图片。训练集和验证集都是10min的视频。
问题1
[Errno 2]No such file or directory:autodl-tmp/SlowFast/ava new/frame lists/train.csv
解决方案:/root/autodl-tmp/SlowFast/ava new/frame lists/train.csv
autodl有一个/root目录
问题2
File "/root/autodl-tmp/SlowFast/slowfast/datasets/ava_helper.py", line 228, in parse_bboxes_file if box_key not in all_boxes[video_name][frame_sec]: KeyError: 0
解决方案:ava_train_v2.2.csv、ava_val_v2.2.csv、ava_detection_train_boxes_and_labels_include_negative_v2.2.csv、ava_detection_val_boxes_and_labels.csv
以上4个文件第2列出现了0,而ava_helper.py中限制了没有第0帧。
问题3
加载完数据之后不开始训练
解决方案:配置文件中AUTO_RESUME
设置为False。
问题4
raise ValueError("loaded state dict contains a parameter group " ValueError: loaded state dict contains a parameter group that doesn't match the size of optimizer's group
预训练模型的网络结构和当前网络结构之间存在不匹配。预训练模型中的优化器状态与当前模型的优化器状态不匹配。
解决方案:注释train.py 中
# if optimizer:
# optimizer.load_state_dict(checkpoint["optimizer_state"])