ReDet复现失败代码注释了一点

吃肉不能购

已于 2023-04-01 14:18:56 修改

阅读量2.2k

点赞数 1

分类专栏：代码运行失败合集文章标签：深度学习 python 目标检测

于 2022-04-22 15:09:55 首次发布

本文链接：https://blog.csdn.net/weixin_44298961/article/details/124073850

版权

代码运行失败合集专栏收录该内容

2 篇文章 0 订阅

订阅专栏

就这么多了，不会再更新了，我得补补自己的知识，我现在读不懂代码。我去看李沐的《动手学深度学习》了。
https://zh.d2l.ai

1.前情介绍

这两天复现完毕设的三篇Baseline了，缺一个idea。
先把这俩月收藏夹的内容看完。
这个是讲深度学习网络参数的含义的。让我对代码有了基本的认识。但是距离作者的贡献点差距还很远。

mmdetection的configs中的各项参数具体解释
https://blog.csdn.net/duanyajun987/article/details/97642146
于是打算逐行看代码。先从ReDet这篇文章入手

2.tools/train.py

因为不知道从哪里开始看，就直接从运行的文件入手吧，总能找到线索的。

#前边这些导包的操作先不看，等到后边调用的时候再看。
from __future__ import division
import argparse
from mmcv import Config
from mmdet import __version__
from mmdet.datasets import get_dataset
from mmdet.apis import (train_detector, init_dist, get_root_logger,
                        set_random_seed)
from mmdet.models import build_detector
import torch
#这个函数用来解析输入的各种参数，从上边 import argparse导入的这个库
#python自带的命令行参数解析包，可以用来方便地读取命令行参数
def parse_args():
	#argparse库的ArgumentParser（）类用来创建一个对象，名为parser，描述是description='Train a detector'
    parser = argparse.ArgumentParser(description='Train a detector')
    #add_argument来添加参数，我猜不带--的是必选参数，带--的是可选参数，我猜的
    #config是配置文件
    parser.add_argument('config', help='train config file path')
    #work_dir一般用来放训练好的模型或者输出的模型，或者运行的log等信息
    parser.add_argument('--work_dir', help='the dir to save logs and models')
    #resume_from 一般用来恢复训练，比如训练到一半停电了，就可以用这个参数找到之前训练好的位置，但是注意，比如训练到25epoch停电了，要从epoch24恢复，因为epoch25.pth可能损坏了，用epoch23也很保险。
    parser.add_argument(
        '--resume_from', help='the checkpoint file to resume from')
    # validate 验证。这个参数我没用过，我猜是用来显示几轮验证一手？？
    parser.add_argument(
        '--validate',
        action='store_true',
        help='whether to evaluate the checkpoint during training')
    #  gpus、顾名思义，跟GPU相关。后边的注释写到：只应用于“非分布式”训练，我没用过（用过，但是不知道那里有变化，没感受到实际效果）
    parser.add_argument(
        '--gpus',
        type=int,
        default=1,
        help='number of gpus to use '
        '(only applicable to non-distributed training)')
    # seed 随机种子？没用过，我猜是用来数据增强的吧？？
    parser.add_argument('--seed', type=int, default=None, help='random seed')
    # launcher 好像是分布式使用的，你可以ctrl F搜索launcher，下边if distribute才调用。
    parser.add_argument(
        '--launcher',
        choices=['none', 'pytorch', 'slurm', 'mpi'],
        default='none',
        help='job launcher')
    # local_rank  我猜也是跟分布式相关的东西，代码中没找到
    parser.add_argument('--local_rank', type=int, default=0)
    # 属性给与args实例: 把parser中设置的所有"add_argument"给返回到args子类实例当中, 那么parser中增加的属性内容都会在args实例中,使用即可。
    args = parser.parse_args()
	#最后吐槽一下，中文社区真的不行，好多函数都搜不到，可能是我菜鸡，而且咱也看不懂英文。
    return args

#终于看到main函数了
def main():
	# 调用 parse_args()函数，返回那些配置参数。
    args = parse_args()
	# Config是mmcv库中的类，从上边导包进来的，fromfile是类的函数，这一行就是把参数传给cfg了，怎么实现的我先不看，睁一只眼闭一只眼。
    cfg = Config.fromfile(args.config)
    
    # set cudnn_benchmark
    # 我看不懂，从百度摘抄的：Benchmark模式会提升计算速度，但是由于计算中有随机性，每次网络前馈结果略有差异。
    if cfg.get('cudnn_benchmark', False):
        torch.backends.cudnn.benchmark = True
    # update configs according to CLI args。根据 CLI args 更新配置
    if args.work_dir is not None:
        cfg.work_dir = args.work_dir
    if args.resume_from is not None:
        cfg.resume_from = args.resume_from
    cfg.gpus = args.gpus

    # init distributed env first, since logger depends on the dist info.
    if args.launcher == 'none':
        distributed = False
    else:
        distributed = True
        init_dist(args.launcher, **cfg.dist_params)

    # init logger before other steps
    # 网上搜的都看不懂，不看了，反正跟模块、分布式有关，跟模型没啥关系。
    logger = get_root_logger(cfg.log_level)
    logger.info('Distributed training: {}'.format(distributed))

    # set random seeds
    if args.seed is not None:
        logger.info('Set random seed to {}'.format(args.seed))
        set_random_seed(args.seed)
	# 嗯，这里开始就构建模型了，from mmdet.models import build_detector。
	# 这里就把输入的那些参数传到构造训练器的函数里。
	# 最后实例化注册过的模型
	# 附上 源码
		#def build_detector(cfg, train_cfg=None, test_cfg=None):
   			# return build(cfg, DETECTORS, dict(train_cfg=train_cfg, test_cfg=test_cfg))
    model = build_detector(
        cfg.model, train_cfg=cfg.train_cfg, test_cfg=cfg.test_cfg)
	# 这里就是添加训练集的参数的，有兴趣的自己用pycharm，按住ctrl单机该函数就能跳转，篇幅原因这里不写了。
    train_dataset = get_dataset(cfg.data.train)
    if cfg.checkpoint_config is not None:
        # save mmdet version, config file content and class names in
        # checkpoints as meta data
        cfg.checkpoint_config.meta = dict(
            mmdet_version=__version__,
            config=cfg.text,
            CLASSES=train_dataset.CLASSES)
    # add an attribute for visualization convenience
    # 添加属性以方便可视化
    model.CLASSES = train_dataset.CLASSES
    train_detector(
        model,
        train_dataset,
        cfg,
        distributed=distributed,
        validate=args.validate,
        logger=logger)


if __name__ == '__main__':
    main()

2022年4月22日14点57分
玩去了。

2.config/…/配置文件.py

读完了 tools/train.py并没有找到核心代码，于是想到了第二个参数是配置文件，去看配置文件找核心代码。


    backbone=dict(
        type='ReResNet', #这里ReResNet是作者创新的部分
        style='pytorch'),
    neck=dict(
        type='ReFPN',#这个也是
       
    rpn_head=dict(
        type='RPNHead', #后边的不确定，因为我没见过。
        # 这个RiRoIAlign也是创新的部分。
        roi_layer=dict(type='RiRoIAlign', out_size=7, sample_num=2),