ReDet复现失败 代码注释了一点

就这么多了,不会再更新了,我得补补自己的知识,我现在读不懂代码。我去看李沐的《动手学深度学习》了。
https://zh.d2l.ai

1.前情介绍

这两天复现完毕设的三篇Baseline了,缺一个idea。
先把这俩月收藏夹的内容看完。
这个是讲深度学习网络参数的含义的。让我对代码有了基本的认识。但是距离作者的贡献点差距还很远。

mmdetection的configs中的各项参数具体解释
https://blog.csdn.net/duanyajun987/article/details/97642146
于是打算逐行看代码。先从ReDet这篇文章入手

2.tools/train.py

因为不知道从哪里开始看,就直接从运行的文件入手吧,总能找到线索的。

#前边这些导包的操作先不看,等到后边调用的时候再看。
from __future__ import division
import argparse
from mmcv import Config
from mmdet import __version__
from mmdet.datasets import get_dataset
from mmdet.apis import (train_detector, init_dist, get_root_logger,
                        set_random_seed)
from mmdet.models import build_detector
import torch
#这个函数用来解析输入的各种参数,从上边 import argparse导入的这个库
#python自带的命令行参数解析包,可以用来方便地读取命令行参数
def parse_args():
	#argparse库的ArgumentParser()类用来创建一个对象,名为parser,描述是description='Train a detector'
    parser = argparse.ArgumentParser(description='Train a detector')
    #add_argument来添加参数,我猜不带--的是必选参数,带--的是可选参数,我猜的
    #config是配置文件
    parser.add_argument('config', help='train config file path')
    #work_dir一般用来放训练好的模型或者输出的模型,或者运行的log等信息
    parser.add_argument('--work_dir', help='the dir to save logs and models')
    #resume_from 一般用来恢复训练,比如训练到一半停电了,就可以用这个参数找到之前训练好的位置,但是注意,比如训练到25epoch停电了,要从epoch24恢复,因为epoch25.pth可能损坏了,用epoch23也很保险。
    parser.add_argument(
        '--resume_from', help='the checkpoint file to resume from')
    # validate 验证。这个参数我没用过,我猜是用来显示几轮验证一手??
    parser.add_argument(
        '--validate',
        action='store_true',
        help='whether to evaluate the checkpoint during training')
    #  gpus、顾名思义,跟GPU相关。后边的注释写到:只应用于“非分布式”训练,我没用过(用过,但是不知道那里有变化,没感受到实际效果)
    parser.add_argument(
        '--gpus',
        type=int,
        default=1,
        help='number of gpus to use '
        '(only applicable to non-distributed training)')
    # seed 随机种子?没用过,我猜是用来数据增强的吧??
    parser.add_argument('--seed', type=int, default=None, help='random seed')
    # launcher 好像是分布式使用的,你可以ctrl F搜索launcher,下边if distribute才调用。
    parser.add_argument(
        '--launcher',
        choices=['none', 'pytorch', 'slurm', 'mpi'],
        default='none',
        help='job launcher')
    # local_rank  我猜也是跟分布式相关的东西,代码中没找到
    parser.add_argument('--local_rank', type=int, default=0)
    # 属性给与args实例: 把parser中设置的所有"add_argument"给返回到args子类实例当中, 那么parser中增加的属性内容都会在args实例中,使用即可。
    args = parser.parse_args()
	#最后吐槽一下,中文社区真的不行,好多函数都搜不到,可能是我菜鸡,而且咱也看不懂英文。
    return args

#终于看到main函数了
def main():
	# 调用 parse_args()函数,返回那些配置参数。
    args = parse_args()
	# Config是mmcv库中的类,从上边导包进来的,fromfile是类的函数,这一行就是把参数传给cfg了,怎么实现的我先不看,睁一只眼闭一只眼。
    cfg = Config.fromfile(args.config)
    
    # set cudnn_benchmark
    # 我看不懂,从百度摘抄的:Benchmark模式会提升计算速度,但是由于计算中有随机性,每次网络前馈结果略有差异。
    if cfg.get('cudnn_benchmark', False):
        torch.backends.cudnn.benchmark = True
    # update configs according to CLI args。根据 CLI args 更新配置
    if args.work_dir is not None:
        cfg.work_dir = args.work_dir
    if args.resume_from is not None:
        cfg.resume_from = args.resume_from
    cfg.gpus = args.gpus

    # init distributed env first, since logger depends on the dist info.
    if args.launcher == 'none':
        distributed = False
    else:
        distributed = True
        init_dist(args.launcher, **cfg.dist_params)

    # init logger before other steps
    # 网上搜的都看不懂,不看了,反正跟模块、分布式有关,跟模型没啥关系。
    logger = get_root_logger(cfg.log_level)
    logger.info('Distributed training: {}'.format(distributed))

    # set random seeds
    if args.seed is not None:
        logger.info('Set random seed to {}'.format(args.seed))
        set_random_seed(args.seed)
	# 嗯,这里开始就构建模型了,from mmdet.models import build_detector。
	# 这里就把输入的那些参数传到构造训练器的函数里。
	# 最后实例化注册过的模型
	# 附上 源码
		#def build_detector(cfg, train_cfg=None, test_cfg=None):
   			# return build(cfg, DETECTORS, dict(train_cfg=train_cfg, test_cfg=test_cfg))
    model = build_detector(
        cfg.model, train_cfg=cfg.train_cfg, test_cfg=cfg.test_cfg)
	# 这里就是添加训练集的参数的,有兴趣的自己用pycharm,按住ctrl单机该函数就能跳转,篇幅原因这里不写了。
    train_dataset = get_dataset(cfg.data.train)
    if cfg.checkpoint_config is not None:
        # save mmdet version, config file content and class names in
        # checkpoints as meta data
        cfg.checkpoint_config.meta = dict(
            mmdet_version=__version__,
            config=cfg.text,
            CLASSES=train_dataset.CLASSES)
    # add an attribute for visualization convenience
    # 添加属性以方便可视化
    model.CLASSES = train_dataset.CLASSES
    train_detector(
        model,
        train_dataset,
        cfg,
        distributed=distributed,
        validate=args.validate,
        logger=logger)


if __name__ == '__main__':
    main()

2022年4月22日14点57分
玩去了。

2.config/…/配置文件.py

读完了 tools/train.py并没有找到核心代码,于是想到了第二个参数是配置文件,去看配置文件找核心代码。


    backbone=dict(
        type='ReResNet', #这里ReResNet是作者创新的部分
        style='pytorch'),
    neck=dict(
        type='ReFPN',#这个也是
       
    rpn_head=dict(
        type='RPNHead', #后边的不确定,因为我没见过。
        # 这个RiRoIAlign也是创新的部分。
        roi_layer=dict(type='RiRoIAlign', out_size=7, sample_num=2),
        

然后就以ReFPN为例子,我们在pycharm中双击shift键,搜索ReFPN,跳转到该文件:mmdet/models/necks/re_fpn.py
和原始fpn.py文件对比阅读,就会发现作者的创新点在哪部分
在这里插入图片描述
举个例子

在这里插入图片描述
在这里插入图片描述
里边对应着不同的点,先不展开说了,接着找不同了。
2022年4月23日20点07分
玩去了

5555 .riroi_align_kernel.cu

一直找不到核心代码在哪里。看train.py之后还是很模糊。
引用博主的连接:
http://t.csdn.cn/q68Hd
他说在:ReDet-master\mmdet\ops\riroi_align\src\riroi_align_kernel.cu

介绍什么是 “.CU”文件。
http://t.csdn.cn/PZD9f

先把程序粘贴上:

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值