项目场景:
入职第三个月的第一天搞崩公司服务器
近期yolov5模型(参考github地址:https://github.com/ultralytics/yolov5)比较火,准备上手更新一下之前用v3做的项目,处理过数据格式问题后,python train.py --img-size 640 --batch-size 16 --epochs 300 --data ./data/score.yaml --cfg ./models/yolov5x.yaml --weights weights/yolov5x.pt
准备运行训练代码,结果发生了内核死循环,进程杀不掉的问题,各种kill命令也不好使,最终只能reboot
服务器解决问题。
问题描述:
python train.py --img-size 640 --batch-size 16 --epochs 300 --data ./data/score.yaml --cfg ./models/yolov5x.yaml --weights weights/yolov5x.pt
开始训练后,服务器发生如下状况: