mmdetection代码解析(1)train.py

42 篇文章 5 订阅
6 篇文章 0 订阅
#coding=utf-8

from __future__ import division

import argparse
import os
from mmcv import Config

from mmdet import __version__
from mmdet.datasets import get_dataset
from mmdet.apis import (train_detector, init_dist, get_root_logger,
                        set_random_seed)
from mmdet.models import build_detector
import torch


def parse_args():
    parser = argparse.ArgumentParser(description='Train a detector')

    # 模型配置文件
    parser.add_argument('config', help='train config file path')

    # log文件和模型文件存储路径
    parser.add_argument('--work_dir', help='the dir to save logs and models')

    # 恢复训练模型的路径
    parser.add_argument('--resume_from', help='the checkpoint file to resume from')

    # 是否在训练过程中评估checkpoint
    parser.add_argument(
        '--validate',
        action='store_true',
        help='whether to evaluate the checkpoint during training')

    # 使用的GPU数量,默认是1,,仅适用于非分布式训练
    parser.add_argument(
        '--gpus',
        type=int,
        default=1,
        help='number of gpus to use '
        '(only applicable to non-distributed training)')

    # 为当前GPU设置随机种子,
    # 在训练开始时,参数的初始化是随机的,
    # 为了让每次的结果一致,我们需要设置随机种子。
    parser.add_argument('--seed', type=int, default=None, help='random seed')

    # 决定是否使用分布式训练,
    # 分布式训练支持多种 launch 方法,
    # 如果launcher为空,怎为非分布式训练
    parser.add_argument(
        '--launcher',
        choices=['none', 'pytorch', 'slurm', 'mpi'],
        default='none',
        help='job launcher')

    # local_rank代表当前程序进程使用的GPU标号
    parser.add_argument('--local_rank', type=int, default=0)

    # 是否使用mixup进行数据增强
    parser.add_argument('--mixup', action='store_true', help='use mixup training.')

    args = parser.parse_args()

    # 如果环境变量中没有指定当前进程使用的GPU标号,则使用参数里指定的
    if 'LOCAL_RANK' not in os.environ:
        os.environ['LOCAL_RANK'] = str(args.local_rank)

    return args


def main():
    args = parse_args()

    # 设置模型配置文件
    cfg = Config.fromfile(args.config)

    # set cudnn_benchmark
    # 设置这个 flag 可以让内置的cuDNN的auto-tuner
    # 自动寻找最适合当前配置的高效算法,
    # 来达到优化运行效率的问题
    if cfg.get('cudnn_benchmark', False):
        torch.backends.cudnn.benchmark = True

    # 根据命令行参数更新模型配置文件中的如下两个配置选项
    if args.work_dir is not None:
        cfg.work_dir = args.work_dir
    if args.resume_from is not None:
        cfg.resume_from = args.resume_from

    # 训练使用的GPU数量
    cfg.gpus = args.gpus

    # 初始化分布式环境,日志初始化的时候需要依赖分布式信息
    if args.launcher == 'none':
        distributed = False
    else:
        distributed = True
        init_dist(args.launcher, **cfg.dist_params)

    # 初始化日志
    logger = get_root_logger(cfg.log_level)
    logger.info('Distributed training: {}'.format(distributed))

    # 为当前GPU设置随机种子,
    # 在训练开始时,参数的初始化是随机的,
    # 为了让每次的结果一致,我们需要设置随机种子
    if args.seed is not None:
        logger.info('Set random seed to {}'.format(args.seed))
        set_random_seed(args.seed)

    # 创建检测器:
    # 模型参数配置
    # 训练参数配置
    # 测试参数配置
    # 得到的model是一个模型类的对象
    # 比如mmdet/detectors/目录下的类的对象
    model = build_detector(cfg.model,
                           train_cfg=cfg.train_cfg,
                           test_cfg=cfg.test_cfg)
    # print(type(model))
    # 输出:<class 'mmdet.models.detectors.mask_rcnn.MaskRCNN'>

    # 根据配置文件加载训练数据
    # 得到一个数据集对象,比如:
    # mmdet.datasets.coco.CocoDataset的对象
    train_dataset = get_dataset(cfg.data.train)


    if cfg.checkpoint_config is not None:
        # 保存mmdet版本信息,模型配置文件内容,目标分类信息到
        # checkpoints作为元数据???
        # print(type(cfg.checkpoint_config))
        cfg.checkpoint_config.meta = dict(
            mmdet_version=__version__,
            config=cfg.text,
            CLASSES=train_dataset.CLASSES)

    # 为便于可视化添加类别属性
    model.CLASSES = train_dataset.CLASSES

    # 训练检测器
    train_detector(
        model, # 模型
        train_dataset, # 训练集数据
        cfg, # 模型配置文件
        distributed=distributed, # 分布式配置开关
        validate=args.validate, # 是否在训练过程中评估checkpoint
        logger=logger # 日志
        )


if __name__ == '__main__':
    main()

 

  • 4
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 8
    评论
mmdetection是一个目标检测框架,train.py是用于训练模型的脚本。在运行mmdetectiontrain.py之前,需要先安装好mmdetection框架及其依赖环境。 train.py的运行需要通过命令行参数来指定模型配置文件和训练数据集文件。首先,需要确定好所使用的模型配置文件,该文件用于指定模型的结构、超参数等信息。其次,需要准备好训练数据集文件,包括训练图片、标注文件等。 在运行train.py之前,可以先配置一些训练参数,如学习率、训练轮数、批量大小等。这些参数可以在命令行中通过设置参数值来指定,也可以直接在train.py脚本中进行修改。可以根据实际需要调整这些参数的数值。 运行train.py的命令形式如下: ``` python train.py ${CONFIG_FILE} [--work-dir ${WORK_DIR}] ``` 其中,`${CONFIG_FILE}`是模型配置文件的路径,`--work-dir ${WORK_DIR}`是可选参数,指定训练结果的保存路径。如果未指定`--work-dir`参数,则默认保存在当前路径下的`work_dirs`目录中。 train.py的运行过程主要分为以下几个步骤:加载配置文件、构建模型、加载训练数据、定义优化器、定义学习率策略、开始训练。在训练过程中,会按照一定的周期迭代进行训练,每个周期结束时会进行验证,并根据验证结果保存最优模型。 训练完成后,可以使用训练好的模型进行目标检测任务。mmdetection还提供了其他功能,如测试模型、评估模型等,可以根据具体需求选择相应的方法进行。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

洪流之源

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值