旋转目标检测对照实验-mmrotate基础教程

环境安装和测试可以参考mmrotate旋转目标检测实战指南_validate mmrotate-CSDN博客

使用自定义数据集训练

如果需要使用自己的数据集进行训练,首先需要把自己数据的标签格式转换为dota数据集的格式,形如(前八个数为坐标值,第九个为类别名,第十为识别困难程度)

475.0 982.0 456.0 982.0 461.0 841.0 481.0 842.0 large-vehicle 0

我这里使用另一个公开数据集MSRA-TD500作为例子,目录结构也模仿dota数据集

MSRA-TD500
├── train
│   ├── images
│   ├── labelTxt
├── val
│   ├── images
│   ├── labelTxt
├── test
│   ├── images

在configs/_base_/datasets中创建一个新的数据集脚本msra-td500.py,参照同级目录下的dotav1.py修改

# dataset settings
dataset_type = 'DOTADataset'
classes = ('words', ) # 注意如果是单类别,要在类别后加一个逗号,否则会报错
data_root = 'data/MSRA-TD500/'
img_norm_cfg = dict(
    mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True)
train_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(type='LoadAnnotations', with_bbox=True),
    dict(type='RResize', img_scale=(1024, 1024)),
    dict(type='RRandomFlip', flip_ratio=0.5),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='Pad', size_divisor=32),
    dict(type='DefaultFormatBundle'),
    dict(type='Collect', keys=['img', 'gt_bboxes', 'gt_labels'])
]
test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='MultiScaleFlipAug',
        img_scale=(1024, 1024),
        flip=False,
        transforms=[
            dict(type='RResize'),
            dict(type='Normalize', **img_norm_cfg),
            dict(type='Pad', size_divisor=32),
            dict(type='DefaultFormatBundle'),
            dict(type='Collect', keys=['img'])
        ])
]
data = dict(
    samples_per_gpu=2,
    workers_per_gpu=2,
    train=dict(
        type=dataset_type,
        classes=classes,
        ann_file=data_root + 'train/labelTxt/',
        img_prefix=data_root + 'train/images/',
        pipeline=train_pipeline),
    val=dict(
        type=dataset_type,
        classes=classes,
        ann_file=data_root + 'val/labelTxt/',
        img_prefix=data_root + 'val/images/',
        pipeline=test_pipeline),
    test=dict(
        type=dataset_type,
        classes=classes,
        ann_file=data_root + 'test/images/',
        img_prefix=data_root + 'test/images/',
        pipeline=test_pipeline))

同时,超参数可以在configs/_base_/schedules目录下选择参考文件修改,最后还要修改模型文件,我这里选择configs/rotated_retinanet/rotated_retinanet_obb_r50_fpn_1x_dota_le90.py,在文件的一开始选择数据集脚本和超参数脚本

_base_ = [
    '../_base_/datasets/MSRA-TD500.py', '../_base_/schedules/schedule_1x.py',
    '../_base_/default_runtime.py'
]

还需要注意,在检测头中要将num_classes改为实际数据集的数量,否则训练还会报错

bbox_head=dict(
        type='RotatedRetinaHead',
        num_classes=1,
        ...

运行训练脚本,添加指定参数即可开始训练。

# 单GPU,如果要在命令中指定工作目录,可以添加参数。--work_dir ${YOUR_WORK_DIR}
python tools/train.py configs/rotated_retinanet/rotated_retinanet_obb_r50_fpn_1x_dota_le90.py 

训练完成后会在保存权重的文件夹里同时保存一个记录训练过程的json文件,通过tools/analysis_tools下的脚本可以画出loss和mAP的曲线图

python tools/analysis_tools/analyze_logs.py plot_curve log.json --keys loss_cls loss_bbox
python tools/analysis_tools/analyze_logs.py plot_curve log.json --keys mAP

可以用test.py验证不同的验证集

python ./tools/test.py configs/rotated_retinanet/rotated_retinanet_obb_r50_fpn_1x_dota_le90.py checkpoints/SOME_CHECKPOINT.pth --eval mAP

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值