mmdetection中模型配置文件的文件命名含义

以faster-rcnn为例

faster-rcnn_r101-caffe_fpn_ms-3x_coco.pyfaster-rcnn_r101_fpn_ms-3x_coco.py 是两个不同的配置文件,它们用于设置 Faster R-CNN 目标检测算法的参数。文件名中的每个部分都代表着一种设置:

  • faster-rcnn: 这代表使用的目标检测算法是 Faster R-CNN
  • r101: 这代表使用的 backbone 网络(即用于特征提取的网络)是 ResNet-101
  • caffe(只在第一个文件名中): 这意味着模型权重从 Caffe 框架转换过来的,而不是 PyTorch 训练的
  • fpn: 这代表使用了 Feature Pyramid Network(FPN),FPN 是一种用于提升小物体检测准确率的特征提取方法。
  • ms: 这代表使用了多尺度训练策略。
  • 3x: 这表示训练周期的长度,3x 表示训练周期被乘以了3。
  • coco: 这代表使用的数据集是 COCO 数据集。

两个配置文件的主要区别在于,faster-rcnn_r101-caffe_fpn_ms-3x_coco.py 使用的是从 Caffe 转换过来的模型权重,而 faster-rcnn_r101_fpn_ms-3x_coco.py 没有指明使用从其他框架转换过来的权重,可能直接是用 PyTorch 训练的权重。

mmdetection是一个开源的目标检测工具箱,支持多种目标检测算法,包括Faster RCNN、Mask RCNN、Cascade RCNN、RetinaNet、FCOS等。在mmdetection,每个模型都有对应的配置文件,用于指定模型的结构和训练参数。 每个模型配置文件主要包括以下几个部分: 1. 数据集:指定训练和验证所使用的数据集路径、类别数等。 2. 模型结构:指定模型的网络结构,包括骨干网络、头部网络等。 3. 训练参数:指定训练过程使用的优化器、学习率、训练轮数等。 4. 测试参数:指定测试过程使用的nms阈值、置信度阈值等。 下面是一个mmdetection模型配置文件的示例: ``` model = dict( type='FasterRCNN', pretrained='torchvision://resnet50', backbone=dict( type='ResNet', depth=50, num_stages=4, out_indices=(0, 1, 2, 3), frozen_stages=1, norm_cfg=dict(type='BN', requires_grad=True), norm_eval=True, style='pytorch'), neck=dict( type='FPN', in_channels=[256, 512, 1024, 2048], out_channels=256, num_outs=5), rpn_head=dict( type='RPNHead', in_channels=256, feat_channels=256, anchor_generator=dict( type='AnchorGenerator', scales=, ratios=[0.5, 1.0, 2.0], strides=[4, 8, 16, 32, 64]), bbox_coder=dict( type='DeltaXYWHBBoxCoder', target_means=[0.0, 0.0, 0.0, 0.0], target_stds=[1.0, 1.0, 1.0, 1.0]), loss_cls=dict( type='CrossEntropyLoss', use_sigmoid=True, loss_weight=1.0), loss_bbox=dict(type='SmoothL1Loss', beta=1.0 / 9.0, loss_weight=1.0)), roi_head=dict( type='StandardRoIHead', bbox_roi_extractor=dict( type='SingleRoIExtractor', roi_layer=dict(type='RoIAlign', out_size=7, sample_num=2), out_channels=256, featmap_strides=[4, 8, 16, 32]), bbox_head=dict( type='Shared2FCBBoxHead', in_channels=256, fc_out_channels=1024, roi_feat_size=7, num_classes=80, bbox_coder=dict( type='DeltaXYWHBBoxCoder', target_means=[0.0, 0.0, 0.0, 0.0], target_stds=[0.1, 0.1, 0.2, 0.2]), reg_class_agnostic=False, loss_cls=dict( type='CrossEntropyLoss', use_sigmoid=False, loss_weight=1.0), loss_bbox=dict(type='SmoothL1Loss', beta=1.0, loss_weight=1.0))), # model training and testing settings train_cfg=dict( rpn=dict( assigner=dict( type='MaxIoUAssigner', pos_iou_thr=0.7, neg_iou_thr=0.3, min_pos_iou=0.3, match_low_quality=True, ignore_iof_thr=-1), sampler=dict( type='RandomSampler', num=256, pos_fraction=0.5, neg_pos_ub=-1, add_gt_as_proposals=False), allowed_border=-1, pos_weight=-1, debug=False), rpn_proposal=dict( nms_across_levels=False, nms_pre=2000, nms_post=2000, max_num=2000, nms_thr=0.7, min_bbox_size=0), rcnn=dict( assigner=dict( type='MaxIoUAssigner', pos_iou_thr=0.5, neg_iou_thr=0.5, min_pos_iou=0.5, match_low_quality=False, ignore_iof_thr=-1), sampler=dict( type='RandomSampler', num=512, pos_fraction=0.25, neg_pos_ub=-1, add_gt_as_proposals=True), pos_weight=-1, debug=False)), test_cfg=dict( rpn=dict( nms_across_levels=False, nms_pre=1000, nms_post=1000, max_num=1000, nms_thr=0.7, min_bbox_size=0), rcnn=dict(score_thr=0.05, nms=dict(type='nms', iou_thr=0.5), max_per_img=100)) ) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Every DAV inci

小辣鸡一枚,不求打赏啦~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值