Python —— Windows10下配置Pytorch环境、进行训练模型并测试
train.py参数解析
1、运行train.py的两种方式:
(1)、使用命令:
python train.py --data data/voc-cs.yaml --cfg models/yolov5s-cs.yaml --weights weights/yolov5s.pt --batch-size 16 --epochs 50 --workers 2 --name base
(2)、在ide或无参命令运行detect.py文件
该方式将方式一的命令参数直接在train.py中修改后执行
2、参数解析
def parse_opt(known=False):
parser = argparse.ArgumentParser()
# 预训练模型权重文件路径
parser.add_argument('--weights', type=str, default=ROOT / 'yolov5s.pt', help='initial weights path')
# 模型配置文件路径(示例:models/yolov5s-cs.yaml)
parser.add_argument('--cfg', type=str, default='', help='model.yaml path')
# 训练数据集路径(示例:data/voc-cs.yaml)
parser.add_argument('--data', type=str, default=ROOT / 'data/voc-cs.yaml', help='dataset.yaml path')
# hyperparameter 超参数文件
parser.add_argument('--hyp', type=str, default=ROOT / 'data/hyps/hyp.scratch-low.yaml', help='hyperparameters path')
# 训练轮数。整个数据集将被迭代的次数,一轮即train.py文件在所有训练集上完成一次遍历
parser.add_argument('--epochs', type=int, default=100, help='total training epochs')
# 每次训练时一批数据中包含多少张图片
parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs, -1 for autobatch')
# 输入图片大小。一组训练集图片可能有不同尺寸,而模型输入接收端口是固定的。因此正式训练前,图片需要先处理成统一的大小,一般处理成正方形,边长为imgsz
parser.add_argument('--imgsz', '--img', '--img-size', type=int, default=640, help='train, val image size (pixels)')
# 训练过程中是否进行图像矫正,例如--rect表示进行图像矫正
parser.add_argument('--rect', action='store_true', help='rectangular training')
# 是否从之前训练中断处继续训练,例如--resume表示从中断处继续训练
parser.add_argument('--resume', nargs='?', const=True, default=False, help='resume most recent training')
# 是否不保存模型,仅会保存最终的checkpoint
parser.add_argument('--nosave', action='store_true', help='only save final checkpoint')
# 正常每轮训练结束后都会验证,设为true则只进行最后一次验证
parser.add_argument('--noval', action='store_true', help='only validate final epoch')
# 不自动确定锚框
parser.add_argument('--noautoanchor', action='store_true', help='disable AutoAnchor')
# 不做图。模型会输出一些图片比如loss随epoch的变化(即收敛情况),设为false则不输出图片。
parser.add_argument('--noplots', action='store_true', help='save no plot files')
# 否进行超参数优化
parser.add_argument('--evolve', type=int, nargs='?', const=300, help='evolve hyperparameters for x generations')
# 是否上传到云。gustil是谷歌云提供的python包,实现数据云上传存储处理等操作;bucket指数据的容器,或理解成cloud上的一个文件夹。
parser.add_argument('--bucket', type=str, default='', help='gsutil bucket')
# 缓存,选择缓存硬件。可以选择在ram或者在disk上进行缓存,默认直接在ram
parser.add_argument('--cache', type=str, nargs='?', const='ram', help='image --cache ram/disk')
# 是否采用图像权重进行选择训练。设为True时,计算图像采集的权重,若图像权重越大,那么该图像被采样的概率也越大
parser.add_argument('--image-weights', action='store_true', help='use weighted image selection for training')
# 运行代码的硬件。可指定cpu或者在某一编号的gpu上运行代码
parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
# 是否多尺度训练图片。设为True时,将图片放缩成多个尺寸,能够得到不同尺度的特征信息,但速度慢。
parser.add_argument('--multi-scale', action='store_true', help='vary img-size +/- 50%%')
# 单类别训练。设为True时,把多类别标签都视为同一种标签进行训练
parser.add_argument('--single-cls', action='store_true', help='train multi-class data as single-class')
# 优化器。默认SGD,有3种可选择'SGD','Adam','AdamW'
parser.add_argument('--optimizer', type=str, choices=['SGD', 'Adam', 'AdamW'], default='SGD', help='optimizer')
# 同步批处理。使用多GPU进行分布式训练时,不同GPU训练batch需要同步。设为True则开启。
parser.add_argument('--sync-bn', action='store_true', help='use SyncBatchNorm, only available in DDP mode')
# 用于加载数据的进程数,例如--workers 8表示使用8个进程来加载数据
parser.add_argument('--workers', type=int, default=8, help='max dataloader workers (per RANK in DDP mode)')
# 运行项目。运行结果保存到文件夹总地址,如runs/train/或runs/detect
parser.add_argument('--project', default=ROOT / 'runs/train', help='save to project/name')
# 名称。即每次运行结果所保存文件夹名称,如设置为exp,不同次项目运行结果将保存到runs/train/exp1或exp2…,后缀会增加
parser.add_argument('--name', default='exp', help='save to project/name')
# 存在正常。不用对exp的数字后缀递增。即设为True,项目运行结果将保存到现有文件夹中,而不是新建一个exp文件夹
parser.add_argument('--exist-ok', action='store_true', help='existing project/name ok, do not increment')
# 是否使用四元数据加载器。一个实验性功能参数,允许小尺寸图片训练时获得高尺寸训练的优势
parser.add_argument('--quad', action='store_true', help='quad dataloader')
# 余弦学习率调度器。设为True时开启余弦学习率调度器
parser.add_argument('--cos-lr', action='store_true', help='cosine LR scheduler')
# 标签平滑。计算的loss有所变化,作用是防止过拟合,但数值过大会导致欠拟合
parser.add_argument('--label-smoothing', type=float, default=0.0, help='Label smoothing epsilon')
# 耐心值。训练提前停止的阈值轮数,若经过patience轮训练,效果一直没有提升,就提前停止训练
parser.add_argument('--patience', type=int, default=100, help='EarlyStopping patience (epochs without improvement)')
# 冻结。冻结网络的指定层,冻结的层的权重在训练过程中不会改变
parser.add_argument('--freeze', nargs='+', type=int, default=[0], help='Freeze layers: backbone=10, first3=0 1 2')
# 保存周期。每一定轮数保存一次checkpoint
parser.add_argument('--save-period', type=int, default=-1, help='Save checkpoint every x epochs (disabled if < 1)')
# 固定训练的随机性
parser.add_argument('--seed', type=int, default=0, help='Global training seed')
# 本地进程号。多GPU模型自动修改,不用手动修改。
parser.add_argument('--local_rank', type=int, default=-1, help='Automatic DDP Multi-GPU argument, do not modify')
# Logger arguments。[logger日志参数4个,不影响模型的运行效果]
parser.add_argument('--entity', default=None, help='Entity')
parser.add_argument('--upload_dataset', nargs='?', const=True, default=False, help='Upload data, "val" option')
parser.add_argument('--bbox_interval', type=int, default=-1, help='Set bounding-box image logging interval')
parser.add_argument('--artifact_alias', type=str, default='latest', help='Version of dataset artifact to use')
return parser.parse_known_args()[0] if known else parser.parse_args()
export.py参数解析
使用命令:
python export.py
def parse_opt(known=False):
parser = argparse.ArgumentParser()
# 数据集目录。改为训练模型时yaml格式数据集路径即可
parser.add_argument('--data', type=str, default=ROOT / 'data/voc-cs.yaml', help='dataset.yaml path')
# 转换后的模型文件路径
parser.add_argument('--weights', nargs='+', type=str, default=ROOT / 'runs/train/base/weights/best.pt', help='model.pt path(s)')
# 输入模型的图片size
parser.add_argument('--imgsz', '--img', '--img-size', nargs='+', type=int, default=[640, 640], help='image (h, w)')
parser.add_argument('--batch-size', type=int, default=1, help='batch size')
# 模型运行设备:使用cpu或某gpu运行
parser.add_argument('--device', default='0', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
# 是否使用半精度FP16export转换 默认=False
parser.add_argument('--half', action='store_true', help='FP16 half-precision export')
# 是否设置YOLOv5 Detect()
parser.add_argument('--inplace', action='store_true', help='set YOLOv5 Detect() inplace=True')
parser.add_argument('--keras', action='store_true', help='TF: use Keras')
# TorchScript转化参数,是否进行移动端优化
parser.add_argument('--optimize', action='store_true', help='TorchScript: optimize for mobile')
parser.add_argument('--int8', action='store_true', help='CoreML/TF INT8 quantization')
# ONNX转换是否要进行批处理变量
parser.add_argument('--dynamic', action='store_true', help='ONNX/TF/TensorRT: dynamic axes')
# 是否简化onnx模型
parser.add_argument('--simplify', action='store_true', help='ONNX: simplify model')
#parser.add_argument('--opset', type=int, default=17, help='ONNX: opset version')
parser.add_argument('--opset', type=int, default=12, help='ONNX: opset version')
parser.add_argument('--verbose', action='store_true', help='TensorRT: verbose log')
parser.add_argument('--workspace', type=int, default=4, help='TensorRT: workspace size (GB)')
parser.add_argument('--nms', action='store_true', help='TF: add NMS to model')
parser.add_argument('--agnostic-nms', action='store_true', help='TF: add agnostic NMS to model')
parser.add_argument('--topk-per-class', type=int, default=100, help='TF.js NMS: topk per class to keep')
parser.add_argument('--topk-all', type=int, default=100, help='TF.js NMS: topk for all classes to keep')
parser.add_argument('--iou-thres', type=float, default=0.45, help='TF.js NMS: IoU threshold')
parser.add_argument('--conf-thres', type=float, default=0.25, help='TF.js NMS: confidence threshold')
# 要将pt文件转为什么格式模型
parser.add_argument(
'--include',
nargs='+',
default=['onnx'],
help='torchscript, onnx, openvino, engine, coreml, saved_model, pb, tflite, edgetpu, tfjs, paddle')
opt = parser.parse_known_args()[0] if known else parser.parse_args()
print_args(vars(opt))
return opt
笔者
笔者 - jxd